大数据

大数据(Big Data)

大数据,官方定义是指那些数据量特别大、数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理。大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity),合起来被称为4V。

大数据中的数据量非常巨大,达到了PB级别。而且这庞大的数据之中,不仅仅包括结构化数据(如数字、符号等数据),还包括非结构化数据(如文本、图像、声音、视频等数据)。这使得大数据的存储,管理和处理很难利用传统的关系型数据库去完成。在大数据之中,有价值的信息往往深藏其中。这就需要对大数据的处理速度要非常快,才能短时间之内就能从大量的复杂数据之中获取到有价值的信息。在大数据的大量复杂的数据之中,通常不仅仅包含真实的数据,一些虚假的数据也混杂其中。这就需要在大数据的处理中将虚假的数据剔除,利用真实的数据来分析得出真实的结果。

阅读全文 »

tar命令详解

语法

1
2
3
4
5
6
7
8
tar {-c | -r | -t | -x | -f} {fileName} [fileList]

-c: 创建一个.tar文件
-r: 在.tar中添加额外的文件
-t: 显示.tar中的文件列表
-x: 提取.tar中的文件到当前目录
-f: 指定文件路径
-z: 以gzip方式解压当前文件

阅读全文 »

Mac下使用IE

如何在Mac上使用IE?

  1. 点击modern.IE,选择要下载的版本,点击Grab them all with cURL获取下载的URL,例如

    1
    curl -O -L "https://www.modern.ie/vmdownload?platform=mac&virtPlatform=virtualbox&browserOS=IE10-Win8.1&parts=5&filename=VMBuild_20131127/VirtualBox/IE10_Win8/Mac/IE10.Win8.For.MacVirtualBox.part{1.sfx,2.rar,3.rar,4.rar,5.rar}"
  2. $ cd ~/Downloads/VisualBox_IE,切换到保存文件的目录;

阅读全文 »

浅谈W3C标准

W3C标准涉及多个方面,官方标准点击这里。从WEB技术应用角度看,可分为三个方面的标准:结构表现行为

  • 结构主要指HTML/XHTML标准,包括页面渲染、标签大小写、属性大小写、标签嵌套、闭合标签等等;
  • 表现主要指CSS标准,包括页面布局、CSS选择器、盒子模型、盒子样式、盒子内容样式、媒体查询(CSS3);
  • 行为主要指Javascript标准,包括对DOM及BOM的操作;
阅读全文 »

进程和线程

进程

并发执行的程序在执行过程中对资源(CPU、寄存器、IO、程序数据)分配和管理的基本单位;

进程状态

  • 初始态
  • 就绪态:就绪态的进程已经获得除CPU之外的其它资源,只要由调度获得处理机,便可立即执行;该状态可细分为内存就绪和外存就绪;
  • 运行态:运行态可细分为用户执行状态和系统执行状态;
  • 阻塞态:阻塞态可细分为内存阻塞、设备阻塞、文件阻塞、网络阻塞、数据阻塞等等;
  • 终止态

注: 进程状态对就绪态、运行态、阻塞态进行了细分,其目的均是为了更好的控制程序,但这是以增加系统复杂性和系统开销为代价;

阅读全文 »

个人博客

问:为什么要搭建博客?

答:记录自己在IT这个行业中的点滴,同时把自己的一些东西分享给各位朋友。

问:为什么不选择已有的博客平台,而要自己搭建?

答:想让事情变得简单点,有想法或解决了一些问题的时候,用Markdown记录一下。

问:……?

答:…………。

问: 你的声音太小,我没听清楚呀。

答: 噢,我给你留言并发送邮件吧,我的Email:arccode@163.com

阅读全文 »