粉丝22获赞1016

不是摸鱼,是分工明确,我能顺利毕业,百分之八十五都是 ai 的 功劳。豆包搭骨架, easy 写出开题初稿草稿 deep sea 润色非输出会议忌要叉 p x o 做表格。我主要负责点头和再改改。员工不多,但也算带领团队独立完成了一项系统性学术实践项目。谁要的?有工作经验的应届毕业生快来认领。

这个世界到底还有没有人类了?我昨天看了你的论文,感觉文笔都是 ai 生成的呀。老师,我自己写的,可能文笔不太熟练,看起来像人工智能, 可是我放在学校那个系统里查了下, ai 生成率九十九点九。老师,对不起,巴拉巴拉,我以后一定严格要求自己不再出现这类问题。空一行,需要我帮你把其中某一条调整的更简洁,适配微信短消息回复吗?

呃,大家好,呃,接下来我会出一个 easy excel 的专辑,那跟大家分享一下 easy excel 里面的一些技术难点,以及我的一些思考。那首先呢,我为什么会去写 easy excel 呢?其实是在一七年的时候,当时我负责了一个商家的后台,那商家会需要通过大概几万到几十万的商品到后台系统, 那当时呢,很自然呢,也去调研了 poi, 就用 poi 来实现这个功能。但是在业务上线的时候呢,那我们发现大的一个 cl 文件啊,导入的时候会把我们整个系统直接给挂掉, 那其实当时,呃已经业务上线时间比较紧,那其实我想了一些方法去临时解决这个问题,那当时主要做了几件事,第一个就是把 excel 的功能从业务系统抽离出来,以为到一个单独的啊定时任务的服务器去执行。第二个就是说,呃,我们限制 excel 五年的大小,比如说限制 大小只能实照,同时里面的数据不能超过一万条。然后第三个就是我们扩大了整个服帖内存啊,正常游戏内存大概八个 g, 那我们处理 excel 空气扩大到六十四个 g, 那就这样呢啊,先临时解决了我们的一些呃问题,然后我的系统上线,但在上线之后呢,其实我就在想,哎,我们已经割了 excel 过去招待我们, 为什么会把我们的这个武器给干坏啊?基于这些人,接下来通过代码我们去看一下那 p o i 到底是怎么干,他会导致内存溢出。准备一个 excel 文件,我们先看看他有多大,嗯,他大概有七十七兆。 那其实知道 excel 格式的同学,可能大家都知道它的呃,其实是一个高压搜的 vip 文件,那我们把它后缀名改成点 vip, 那我们来解压这个文件,然后看看它会里面到底是一些什么数据。那我们解压完之后,看到里面有 x mar, 刀口 pro, 然后以及呃 content types, 对 等等的一系列擦描,我们看到这里面有十二点 spring 点擦描,然后有 work work sheets, 然后有 sheet 一点擦描,这里面核心词呢就是我们的数据,我们看一下这个 sheet 大概有多大,那这个 sheet 就有四百四十多兆, 那其实它是一个高压缩的 vip 文件,那接下来我们分别使用 p o i 和 easy excel 来解析一下,看看它们解析的结果如何。那首先我们用呃 easy excel 它的解析, 那我们设置一下它的内存,我们把它的内存设置小一点,就二十兆号,只有 p o i 的十分之一,那我们看一下它能不能解析出来。 嗯,大家可以看到他没有内存一株,他已经开始在解析了,他已经读出了第一行,那很快他已经读了十万, ok, 他很快就执行结束了,大概用了三十二秒钟,那他把整个四十万的文件直接解析出来了。 ok, 那我们接下来看一下,为什么 easy cat 会导致内存溢出呢?我们来走一下他的代码去看一下。 那首先就是这个啊,创建他的乌克对象,我们看一下他里面做了什么事情,那继续往下走,那我们到这里的时候,其实我们看一下他上面的这个注视, 其实就是说啊,这个方法如果你是通过流打开的,那他所有的文件加缩会在内存,那刚才我们看到 整个啊 excel 的解压扣的文件大概有五六百兆,那这些内存全部会放在内存里,大家可想而知,那当然他又说了可以通过 openspin 啊这个方法,然后打开,其实他的内存会更少,那这个其实他核心原理就放在磁盘,那我们回过头再往前看,除了这里还有其他地方,哪里会导致内存移出?那我们打开这个, 然后我们再看他的啊 low 的方法,然后再看他的 on document read, 我们看一下他的实线方法,那我们继续往下,那我们看一下他 pass three pass she 他是怎么做的 那呃,大家很简单的,就是再看一下到这个昂刀克美特瑞的,那到这里其实大家基本上可以看出来,就是带我们看看一下他的引力特肉是怎么做的。 其实在这里大家其实都能看到,他其实在这里就是把所有的每一行数据全部解析完,解析完之后呢,其实他存在了这个 rose 这个文件,那大家可以想想,那我们整个文件有四百万啊,四百万行的数据, 那他四十万行的数据他就全部解析放在内存了,大家可想而知,他在盈利的时候就已经把全部的数据放在内存了,那当然他的内存就会很大。那那今天我们先先了解清楚他为什么会内存, 通过代码看到了啊,这两个地方是核心导致他内存溢出的地方。 ok, 那还有些同学会问我啊,你是怎么做开源呢?那怎么把它做到大家都去使用呢?那其实我有几点建议,那第一个其实就是说我们要去发现问题,核心就是敢于去质疑一些权威。 刚才我们去看了 py 的代码,其实我们通过他的实现其实就知道他哪里会出现内存一触,那基于这些呢?其实我们去敢于去质疑。第二个其实就是思考问题, 那我们发现了这个问题,其实我们在想有没有办法去解决呢?那其实我们知道,呃, excel 里面既然都是叉 ml 文件,那我们为什么不可以通过萨克斯模式去解析它呢?这样子是不是就会很省内存?那这是我们去思考问题。第三个就是解决问题, 既然我们思考也想到了,那我们就动手去做,把它去给实现掉。然后第四个其实就是还是一个很核心的点,就是持之以恒。那 e、 z、 x、 l 之所以到 到现在被大家很多人去使用,其实很重要的原因是我们在啊一七年就做开源,到现在有六年时间,我们坚持在维护和坚持在接待,我觉得这个也是很重要,一个好的产品要想被大家广泛去使用,其实你一定要不断的打磨,做的很好。对,谢谢大家。

等等,你是说初稿写完了才一个个手动调整格式?这得改到什么时候啊?难道你们不知道这个 overleaf 工具吗?左边改段落书公式,右边直接自动生成 pdf 图片对齐段落间距、公式格式全部用手动调,系统自动帮你搞定,而且还支持多人写作功能,写完直接分享链接给导师修改意见实时同步,再也不用反复传文件改版本,沟通效率直接拉满! 如果你的初稿已经写完,格式还一团糟,也别慌,咱们还有 paper 写这个工具,找到你的学校,再上传你的初稿格式排版,直接一键搞定,再也不用为格式调整熬夜秃头!