@jersey 你怎么也沦为sql人(
@jersey 那不错!我已经不禁怀疑起这个世上真的有用python 的分析岗吗……我部门所有的analist都是用spreadsheet,只有一个人用Tableau。
@yan132 我们其实是要写点pyspark的,只是我现在还用不到。但是写的话也只是用很简单的一点python
SQL还是用的最多的
@jersey 这样啊。我有想下学期要不要上大数据……看来没必要了()
@yan132 我觉得大数据还是很有用呀,很多jd都有写要求spark经验来着。
@jersey 我觉得pyspark蛮有意思(不过我对Excel都感兴趣
)我之前学sql(Interactive Data Transformation )的时候有两节课讲spark ,不过没什么练习,我还不是很熟悉具体操作……我花了一下午试图安装pyspark,太过复杂,我最后放弃()
@yan132 excel还是有用的,再怎么样都还是要跟spreadsheet打交道。
我之前很好奇要怎么自学spark来着,毕竟自己是没有那么大的数据库的
@jersey 确实……excel就是很简单和直观,不需要太多写码的功底也能直接上手(Power BI和Power Query我感觉蛮有用的 )。我不知道自学怎么学,我直接从安装开始栽倒
不过keggle上应该能下载不少大的数据库。
@jersey 我这几天在建数据库,我觉得Excel的问题是太慢了,数据一多就很占地方,和Gsheet的兼容也有点问题。最大的问题是,不该被用来当数据库管理工具的却被全组人拿来存数据 ![]()
@yan132 用excel存数据挺雷的……除非是那种临时用一下的。而且行数不是有限制么……
前两年荷兰防疫弄出过笑话来着,感染数据存在excel里,结果达到上限了,导致三天零新增。也不知道丢的数据找回来没有
@jersey 哈哈哈哈哈哈我第一次听说这个笑话。说起来比较复杂,不过我在弄的这个数据库,分散在公司好几个应用里,我们组的人每次是做了一些总结再手动复制粘贴到excel里,也因为他们分门别类存了无数个tab和file,所以数据量远没到上限()
我感是因为公司太大了,数据类型多又杂……肯定有人真正在做数据管理的事,但是跟我们组没啥关系()
@yan132 这种也太容易出问题了……你到时候肯定很有data engineer的经验哈哈
@jersey 不错!SQL四舍五入好歹是码 ![]()
@yan132 excel当然也用,不过不多