Mac安装Hive1.2.1

这几天在折腾Hive的相关东西,所以打算在自己的机器上安装下Hive,可是按照教程总是出这样那样的错误,着实蛋疼,最终发现错误是我的Mysql端口是3307,WTF。。这个问题已经坑了我几次了。在此把查看Mysql开启端口的命令放这,以后别被坑到了。SHOW GLOBAL VARIABLES LIKE 'PORT';

推荐系统算法介绍

实习这俩天又有新任务了,要把之前搁置的推荐的“猜你喜欢”部分做起来,重新开始推荐算法的研究,之前看过一阵子推荐算法的东西,再借此机会复习下。其实从大的分类一共就四大类推荐算法吧,基于人口统计学的,基于内容的,协同过滤和混合推荐。

两场面试

昨天和今天分别经历了百度和新浪的两场面试,岗位都是数据挖掘工程师,都是亲师兄头天内推第二天面试的这种突击战,但面试风格迥然两个极端,一个是百度至少T5的高级工程师,一个中科院博士算法大牛。虽然表现不咋地,但是很庆幸内推的头两场面试碰见这样的面试官,收获挺多。

设计模式总结

什么是设计模式

在软件工程中,【设计模式】是对软件设计中普遍存在的各种问题,所提出的解决方案

换句话说,设计模式是一套被反复使用、多数人知晓的、经过分类的、代码设计的经验的总结。使用设计模式是为了可重用代码,让代码更容易被他人理解,保证代码可靠性。

MapReduce运行机制

谈mapreduce运行机制,可以从很多不同的角度来描述,比如说从mapreduce运行流程来讲解,也可以从计算模型的逻辑流程来进行讲解,也许有些深入理解了mapreduce运行机制还会从更好的角度来描述,但是将mapreduce运行机制有些东西是避免不了的,就是一个是参与的实例对象,一个就是计算模型的逻辑定义阶段,我这里讲解不从什么流程出发,就从这些一个个牵涉的对象,不管是物理实体还是逻辑实体。

,