大数据的特点 Hadoop与Spark Hadoop 是一种分布式计算平台,用Java编写,可运行在Linux、Windows以及类Unix系统上。包括两个核心技术,HDFS和Mapreduce。HDFS实现数据的分布式存储,MapReduce实现数据的分布式计算(通过Map和reduce两个函数实
在你所在的公司(行业,领域)内,正在用大数据处理哪些业务?可以用大数据实现哪些价值? 我们公司是做游戏引擎开发的,公司有个产品是 Cocos Analytics, 主要用途有
导致系统不可用的原因有哪些?保障系统稳定高可用的方案有哪些?请分别列举并简述。 原因: 硬件故障 系统 bug 系统维护升级发布时短时不可用 用户访问量大导致并发压力过高,超过系统承载上限 遭受网络攻击等,导致系统负载过高崩溃 自然灾害等外部因素 高可用架构: 使用服务集群 假设只有一台服务器执行所
安全 攻击 XSS 跨站脚本攻击(XSS),是最普遍的Web应用安全漏洞。这类漏洞能够使得攻击者嵌入恶意脚本代码到正常用户会访问到的页面中,当正常用户访问该页面时,则可导致嵌入的恶意脚本代码的执行,从而达到恶意攻击用户的目的。 SQL注入 SQL注入即是指web应用程序对用户输入数据的合法性没有判断
请简述 JVM 垃圾回收原理。 1. Java中的四种引用类型 在Java中,对于引用最基本的解释就是:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用(有点指针的意味)。后来Java还将引用划分为了4种,根据被GC回收的时机可以分为:强引用(S
有两个单向链表(链表长度分别为 m,n),这两个单向链表有可能在某个元素合并,如下图所示的这样,也可能不合并。现在给定两个链表的头指针,在不修改链表的情况下,如何快速地判断这两个链表是否合并?如果合并,找到合并的元素,也就是图中的 x 元素。请用(伪)代码描述算法,并给出时间复杂度和空间复杂度。 计
数据结构与算法 算法性能评测 时间复杂度:算法语句执行的次数 空间复杂度:运行中临时占用的空间大小 常用数据结构 数组:存储在连续的内存空间,查询快捷,插入较慢。按下标查询时间复杂度O(1) 链表:可以使用零散的内存空间,查询较慢,插入较快。查找时间复杂度O(n) Hash表:数组加链表 栈:后进先
判断系统性能的两个角度 主观角度和客观角度,主观角度是用户感受到的性能观感,客观角度是是指系统的响应时间之类的性能指标衡量的性能。 性能测试 性能测试是性能优化的前提和基础,也是性能优化结果的检查和度量标准。不同视角下的网站有不同的标准,也有不同的优化手段。 性能测试指标 不同角度有不同的性能标准,
性能压测的时候,随着并发压力的增加,系统响应时间和吞吐量如何变化,为什么? 并发:单位时间内,系统同时处理的提交请求的数量,一般为秒级时间 系统响应时间:系统从收到用户请求到处理完用户请求并返回响应结