主要是写SQL 真的很难保持心流……

@yan132 我是product analyst,好久没碰python了都

@jersey 那不错!我已经不禁怀疑起这个世上真的有用python 的分析岗吗……我部门所有的analist都是用spreadsheet,只有一个人用Tableau。

@yan132 我们其实是要写点pyspark的,只是我现在还用不到。但是写的话也只是用很简单的一点python

SQL还是用的最多的

@jersey 这样啊。我有想下学期要不要上大数据……看来没必要了()

@yan132 我觉得大数据还是很有用呀,很多jd都有写要求spark经验来着。

@jersey 我觉得pyspark蛮有意思(不过我对Excel都感兴趣 :azukisan023: )我之前学sql(Interactive Data Transformation )的时候有两节课讲spark ,不过没什么练习,我还不是很熟悉具体操作……我花了一下午试图安装pyspark,太过复杂,我最后放弃()

@yan132 excel还是有用的,再怎么样都还是要跟spreadsheet打交道。

我之前很好奇要怎么自学spark来着,毕竟自己是没有那么大的数据库的

关注

@jersey 我这几天在建数据库,我觉得Excel的问题是太慢了,数据一多就很占地方,和Gsheet的兼容也有点问题。最大的问题是,不该被用来当数据库管理工具的却被全组人拿来存数据 :azukisan008:

@yan132 用excel存数据挺雷的……除非是那种临时用一下的。而且行数不是有限制么……

前两年荷兰防疫弄出过笑话来着,感染数据存在excel里,结果达到上限了,导致三天零新增。也不知道丢的数据找回来没有

@jersey 哈哈哈哈哈哈我第一次听说这个笑话。说起来比较复杂,不过我在弄的这个数据库,分散在公司好几个应用里,我们组的人每次是做了一些总结再手动复制粘贴到excel里,也因为他们分门别类存了无数个tab和file,所以数据量远没到上限()
我感是因为公司太大了,数据类型多又杂……肯定有人真正在做数据管理的事,但是跟我们组没啥关系()

@yan132 这种也太容易出问题了……你到时候肯定很有data engineer的经验哈哈

登录以加入对话
雾海

雾海是一个开放且不限制讨论主题的非营利性中文社区,名字来源于德国浪漫主义画家 Friedrich 的画作《雾海上的旅人》。生活总是在雾海中吞吐不定,不管怎么艰辛,他还是站在了这里!希望大家在这里玩的开心~