00:00 / 00:11
连播
清屏
智能
倍速
点赞NaN
AI 是怎么“看懂”一张图片的? 从技术上说,AI 根本看不到“猫”、“树”或者“人脸”,它看到的,只是一大堆数字。 一张彩色照片,在电脑里会被拆成无数个小格子——也就是像素。 每个像素都有对应的数值,表示这个点有多亮、是什么颜色。 如果把整张图展开,就会得到一个巨大的数字表格,也就是所谓的“数值矩阵”。 所以,对 AI 来说,一张猫的照片,其实就是一块密密麻麻的数字地毯。 那它是怎么从这块“数字地毯”里,认出“这是只猫”的呢? 这里要说到一个核心工具:卷积神经网络,简称 CNN。 可以把它想象成一台“特征扫描机器”,拿着一个小小的“放大镜”,在图片上来回滑动。 这个“放大镜”其实就是一个小窗口,窗口里一次只看图片的一小块区域。 AI 会用同一块“放大镜”,从左到右、从上到下,把整张图都扫一遍。 在扫描的过程中,它主要在找几类信息: - 哪里有明显的边缘和轮廓 - 哪些地方颜色变化很剧烈 - 哪些区域有规律的纹理或形状 如果用比喻来说: - 最底层的卷积层,好像一个只会看“线条和小斑点”的画家学徒 - 再往上的几层,开始能看出“这是个圆”“这像是个三角形”“这里像一块毛茸茸的区域” - 再往上,就能把这些“局部线条”和“小块纹理”拼起来,变成“这是只耳朵”“这好像是眼睛”“这里像是猫的身体轮廓” 这一层一层往上,就像从看拼图碎片,慢慢拼出整幅画。#科普一下
00:00 / 01:45
连播
清屏
智能
倍速
点赞3
00:00 / 00:30
连播
清屏
智能
倍速
点赞7
00:00 / 10:46
连播
清屏
智能
倍速
点赞664
00:00 / 00:15
连播
清屏
智能
倍速
点赞37
00:00 / 00:18
连播
清屏
智能
倍速
点赞1079
00:00 / 00:51
连播
清屏
智能
倍速
点赞0