牟瑞

大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我!

始于: 2013-06-09

发私信

1967

总声望

308

次被推荐

16

粉丝

他的回答
排序:

1
投票

请问老师: 抓取内容出现\u56fd\u5bb6等而不是中文内容是怎么回事

这个是unicode编码,做一下编码转换,变成UTF8编码的就可以了。

2016-08-28 20:56 回复了该问题
0
投票

kettle在linux启动spoon.sh报错

[url]http://unix.stackexchange.com/questions/94497/org-eclipse-swt-swterror-no-m...

2016-08-26 14:23 回复了该问题
0
投票

问个问题,scala循环遍历的时候,在循环外有一个变量,循环里改变这个变量的值,在本地使用local的时候没问题,但是放到spark集群上,这个变量就取不到值了,是不是并行计算导致的?

很明显是这样的,最好是使用线程安全的变量,或者把变量存储在缓存服务器上,不然一台服务器初始化,另外的服务器不一定能获取到。

2016-08-26 10:36 回复了该问题
0
投票

hbase可以不通过hostname直接通过配置IP解析地址吗

可以,但是一般没有这么干的。因为Hostname可以人为标识salve1,salve2这多清晰啊。。IP地址怎么记得住啊。。而且一般host都是固定的,IP地址...

2016-08-26 10:34 回复了该问题
0
投票

我已经安装了hadoop,配置都已经完毕,在云主机上,telnet 公网ip 9000可以连接,在本地window下telnet 公网ip 9000无法连接

哪家的云主机?一般云主机的外网端口都是禁止对外开放的,你看下防火墙的策略是否有限制。 有下面的场景的时候确实会出现你这种情况。。就是最外层的防火墙限制了外面服务...

2016-08-26 10:30 回复了该问题
0
投票

各位,请教一个问题。HDFS做了HA后,Hive 这边怎么去感知Namenode的切换问题了?

高版本这块是否做了优化,不太清楚,但是低版本是感知不到的,如果发生了切换hive会报org.apache.hadoop.ipc.StandbyException...

2016-08-26 10:25 回复了该问题
0
投票

如果一个flask程序,放云服务器上,代码app.run(host='0.0.0.0',port='80'), 命令行python app.py运行 公网可以访问,缺点是什么,是不是只能单用户访问?

你觉得应该是有什么缺点呢?可以列举几点,然后讨论一下。 首先:不存在只能单用户访问的问题,这本身就是一个server端的代码,肯定是支持多个用户访问的啊,除非你...

2016-08-26 10:09 回复了该问题
0
投票

pyopenssl 和pythonopenssl 有啥区别 ?

区别是不是一个人实现的,所以具体的实现细节上会有所不同。

2016-08-25 13:56 回复了该问题
0
投票

想请请教一个问题,2.5GB的txt文件要用python如何处理,内存6GB的pc机。

要处理什么啊?直接load到内存也是可以的啊,如果你只是做word count,逐行读取,逐行处理,也就用几M的内容。

2016-08-25 13:55 回复了该问题
0
投票

如何在eclipse中构建 pentaho5.4 Bi 工程

你是从git上下载的源代码打包zip文件吧? 把文件解压,然后使用eclipse或者IDEA导入maven项目就可以了啊。5.0版本我曾经编译过过,是可以的。

2016-08-25 13:53 回复了该问题
0
投票

请问下这个警告怎么处理?DeprecationWarning: This function is deprecated. Please call randint(0, 1 + 1) instead for _ in range(n_resampling))意思是这个函数已过期,让用后面的,但是在不知道怎么理解

没事,这只是已经警告,不妨碍你使用并执行代码。 这个警告的意思是说,你现在正在使用的这个方法已经有了更好的实现,推荐你使用randint

2016-08-25 10:54 回复了该问题
1
投票

问下大家,python的控制台和解释器有什么区别呢?

控制台只是一个交互的界面。在交互界面上输入的Python代码需要交给python的解释器去执行解释,翻译成机器能识别的字节码,然后去执行。

2016-08-25 10:52 回复了该问题
0
投票

jupyter notebook 的代码字体怎么修改成consola

[url]http://stackoverflow.com/questions/22386359/how-to-change-font-in-ipython-n...

2016-08-25 10:50 回复了该问题
0
投票

请问selenium 在get 的时候 一直处于等待状态 怎么打断? 使用 set_page_load_timeout 将没有办法进行后续操作 这如何解决呢?

没有用过selenium,但是说下现有的知识的理解:首先本身selenium就是一个无界面的浏览器框架,框架比较庞大,你可以设置set_page_load_ti...

2016-08-12 08:45 回复了该问题
0
投票

pandas加载mysql无法通过运行,没有错误提示

数据量太大,无法放入内存里面。尝试缩小数据规模。 Python的好处是在于快速实现,验证。但是,目前还不是很适合大规模的单机数据处理,你可以将你的想法在你本地验...

2016-08-11 09:12 回复了该问题

改版

反馈