粉丝6.6万获赞108.9万

爬虫我告诉你啊,你用什么语言都能做啊,用什么语言都能做,就是你拿你,你擅长扎瓦,你扎瓦玩的溜,拿扎瓦搞没问题,对吧?你拿那个 c 血也没问题,哎,你拿那个以前还有人用什么那个异语言 一元,他就是我说的难听点啊。这个可能做一元的人不太认同,但是呢,我反正因为我对一元了解的没有那么深,对吧?但我只能说我的感官,我的感官是一元,就是以前的威力。 好吧,我的感官就是 vb, 然后呢?那个那个呃,界面的那个版 vb, 把那个 vb 拿出来,然后弄了一个弄,就翻译成了中文啊,他写的代码都是中文的代码知道吧?那么 e 语言也好, c 也好,扎瓦也好, pass 也好, go 也好,都可以做爬虫,只要是写编程的,是编程语言都可以做爬虫,包括 gs 都可以去写爬虫。那为什么选 pass 呢?为什么选 pass 呢?因为你要明白 passing 在 这个方面,第一,他有非常大的就是那个那个展,就是就是去搞代码的空间,而且拍子有很多的第三方库的支持,就拍子这玩意生下来就有人拿拍子去写写写写写写马桶,就有人去写一些第三方库, 对吧?所以拍子在这些个这些个编程语言里面,他是对对对,这个爬虫支持最多第三防护的这么一个语言理解吧,所以拍子第一比较容易,那么第二是什么呢?第二是当你搞爬虫搞多了,你就发现了最终写的那个代码其实很简单, 知道吗?最终你写的那个代码,你用拍死也好用,扎瓦也好用, go 也好用,谁写其实都一样,核心不在那个代码身上,理解吗?核心在哪?爬虫的最终,最终你,你走到走到最后的阶段的时候,对吧?你写的那个拍死的代码不重要,很 很简单,那个玩意就很简单,差不多点学一点点就会,我告诉你难点在哪,真正的难点,真正的值钱的玩意是谁?是那个逆向的过程和逆向出来的那个东西, 理解吗?是逆向,比如说你搞这,你搞网页的逆向,知道吧?网页的逆向,那么真正的值钱的有用的东西是什么?是你逆向的那个过程?是你找到人家加密入口的那个方案,是你能把人家加密算法能抠下来,能为你所用的那个逻辑, 知道吧?那个玩意难,那个玩意难,不管是 gs 要还是那个 app 也好找逆向的入口,把逆向的过程抠下来,这个过程难。而真正最终你写代码的时候我跟你讲啊,最终写的代码十个案例有八个是一样的,就换换 gs, 所以什么语言根本不重要,重要的是那个逆向的过程,知道吧?哎,所以明白了吧?哎,明白。 而为什么最终非要用潘森做?第一潘森酷多,第二潘森,对于这个这个这个学习来说是很容易的啊,你说你搞个扎瓦,拿扎瓦去写,怕什么?能写你要学扎瓦的,先来面相对象吧,对吧?面相对象,你先来个什么?丰登基层多肽吧,对吧?一个多肽搞死一帮人, 真的一个多彩搞死一帮人,知道吧?所以,就是就是,这拍森有非常好的上手的这这么一个特性,是吧?哎,所以呢,大家都会选择用拍森来去做这个爬程啊,简单,上手快,容易啊,而且核心还不在他 核心还不在他,哎,很多的。我跟你讲 pass 这个语言的应用领域,兄弟们, pass 语言的应用领域,你仔细琢磨啊,你去琢磨这玩意,不能我一个人说,你去琢磨来,人工智能是不是用 pass? 数据分析是不是用 pass? 爬虫是不是用 pass? 显示科学计算的模型也会用 pass? 还有什么呢?就是有人会拿 pass 做外部 对吧?会,会拿拍子做外吧,但是你要知道拍子在整个行业里面最牛的一个点就是 ai 了吧,人工智能数据分析了吧,对不对?这俩玩意?基本上你只要说这俩玩意一定会选拍子,你要说做个外吧,大家首选是谁?什么?呃?大点项目用扎瓦,小点项目 pap, 对不对? 都都这个这个逻辑吧。啊?这个这个需求,如果说这个要求效率高一点的话,用够对不对啊?很少有人会首选拍摄,对吧?那么各位问题来了,为什么说啊?量化用拍摄?对,量化也用拍摄,量化呀?人工人工智能啊,这个这个这个这个数据分析啊,都用拍摄,这是拍你最核心的一个一个支撑点,那么各位,你们想过没有?为什么? 为什么,对吧?我告诉你原因啊,因为这几个玩意的核心都不在编程身上,能理解吗?想想,想想 ai 人工智能的核心是什么?是数学,是算法对吧?是数学,是算法,是他那个那个那个 那个叫什么?模型对不对?然后呢?数据分析是什么?是数据,数据分析的逻辑维度对吧?是这套东西。然后呢?什么?量化的?这个核心是什么?是你交易的那个逻辑, 对吧?所以他们的这三个玩意的核心都不在编程上,能理解吗?而不在编程上就意味着什么呢?假设搞 ai 的,我是搞 ai 的,我最早搞 ai 的。好了,我每天研究的是什么?是数学? 是数学公式?是欧拉公式,对吧?每天研究的是这东西。然后呢?突然有一天我发现这玩意可以做人工智能好了。那么问题来了,我数学很 ok, 但是编程 一窍不通,对吧?编程一窍不通,现在我非常的希望能有一个语言,能干嘛?能让我把我的数学上的公式应用在计算机领域。那么问题来了,兄弟,问题来了,我怎么选择?你说我选个渣吧。好家伙,上来三就是面向对象,什么封装、继承、多态,对不对?什么玩意,对吧?我也 搞数学的,什么玩意给我了?不对,所以他会选一个什么?选个最简单的,最容易上手的,只要能把我这套数学模型跑出来就行了,对吧?所以他们选谁?选牌子?

为什么只有 python 可以爬虫, c 加加也可以写爬虫吗?其实 c 加加也是可以的,但有两个因素决定了 python 更适合写爬虫。一,处理字符串是 python 天生的优势, re, gc, unicode 等等特性实在太方便了。如果是 c 加加的话,处理 no terminated string 就 够你爽的了。虽然可以用 std string, std or string, 但并不是所有的第三方库都兼容这些,处理各种乱七八糟的问题,还不如像 python 拿来就用。二,很多爬床代码是一次性的,你写了一个模式牌种类型的页面,很显然这种页面很快就会变化了, 你的模式也要跟着变。拍葬的代码不需要编译就可以跑, c 加加要编译看着虽然也就差一会,但是如果里面有一千种页面呢?而且很多模式可能今天用着明天就丢了,你非要写,那么认真干啥呢?