00:00 / 01:22
连播
清屏
智能
倍速
点赞2202
00:00 / 02:58
连播
清屏
智能
倍速
点赞321
00:00 / 01:15
连播
清屏
智能
倍速
点赞617
00:00 / 00:33
连播
清屏
智能
倍速
点赞71
00:00 / 00:19
连播
清屏
智能
倍速
点赞81
00:00 / 12:59
连播
清屏
智能
倍速
点赞13
00:00 / 03:10
连播
清屏
智能
倍速
点赞33
00:00 / 01:32
连播
清屏
智能
倍速
点赞39
00:00 / 03:11
连播
清屏
智能
倍速
点赞132
00:00 / 01:45
连播
清屏
智能
倍速
点赞1
智珲论11月前
探索:DeepSeek火了,我搞了个能杀毒的人工智能 7天时间,2200行最终代码,我终于打造出了一个能脱机识别未知木马病毒的人工智能,而在此之前,我对如何训练人工智能模型一无所知。 好了,今天就让我带领同学们,以一位初次接触人工智能的小白为第一视角,如何从零开始应用人工智能解决工程化问题,并产出一个最终产品。 说起人工智能,大家应该就都不困了,但是如何使用一个本地的AI模型区自动分辨病毒,我想大多数同学们应该还没接触过。 其实,对于对于我来说如何分辨一个病毒并不难,无非是静态分析与动态分析两种途径,静态分析就是分析文件结构与文件映像,而动态分析则是分析程序行为与API调用序列。 但难的是我在人工智能应用领域完全是小白,既没有实际的项目经验,也没了解过数据分析,在此之前甚至连特征工程是啥都没听说过,除了跟各种大语言模型唠嗑解闷基本上就没做过更深入的研究了。 因此,挡在我面前的第一个问题就是如何挑选模型框架,以及选择什么模型框架干这个事最合适。 就简单的辨黑白,也就是分辨是不是病毒木马来说,我认为最重要的是效率,这个效率可以分为两个方面,一个是训练效率,另一个就是运行效率。 关于训练效率,我的标准是“钱多、事少、离家近”。 钱多,意思就是效果好,技术得新、各方面适应新得强,另外最好有大厂背书,稳定、有未来。 事少,意思就是好伺候,其训练时的自适应能力要在线,毕竟我是第一次接触,主要目的是最终跑通并且可用,如果上来就需要掌握各种特征工程的若干技巧与注意事项,准备着些训练数据对于我来说会很不友好,比如最终训练出来的模型不尽如人意的话,是样本有问题、还是特征工程有问题或是训练调参有问题? 离家近,意思就是训练样本需要的少,如果上百万样本才能训出效果,叫我上哪找那50万个病毒木马与50万个正常程序去?我希望这是一种训练样本门槛为万级左右的模型,我这毕竟是一个人做,还是第一次,能搞到一万个训练样本已经很不容易了。其实对于我来说搞病毒木马的样本其实也并不难,难的是搞正常程序的样本,假设我们最终将训练数据集定位1万个的话,那么我就需要搞到5000个正常应用程序的样本,这对我来说还是有挑战的。 #干货分享 #人工智能 #网络安全 #科普 #Deepseek
00:00 / 18:56
连播
清屏
智能
倍速
点赞14
00:00 / 09:21
连播
清屏
智能
倍速
点赞27