昨天看好几个博主发关于福布告的视频,忍不住去试了下,总体感觉是非常强大,一种全新的人机交互体验学习,可以把它作为探索世界的工具教学,它完全胜任超级助手。打开是超级简洁的页面,交互界面也同样极简而友好,可以在对话框直接输入需求,也可以上传图片。 我们先尝试第一种,比如我想五一期间到青岛旅游,让他帮我生成一个三天旅行指南,然后就出来这样一张手绘风格的可交互画面,从第一天到第三天做了详细的行程规划,还有温馨的交通提示与美食推荐,我可以点击画面上的任意部分进行下一步交互。 比如我点击第三天行程上的啤酒博物馆,他就又生成了一张啤酒博物馆深度旅游指南,并贴心的附上了地址及游玩时间建议 我继续点击画面中的相应部分,他又进一步生成了啤酒的酿造过程,继续点击继续生成对应的部分,非常涨知识。接下来我新开一个窗口,上传一张图片, 让他帮我生成小朋友的科普材料,同样可以点击感兴趣的部分,继续生成相关内容,只要你感兴趣,可以一直互动下去,感觉真的非常棒。唯一的缺点就是速度稍微有点慢,不过还可以接受关注我,后续我会继续分享 freebook 的 应用体验。
粉丝25获赞268

那大家现在看到的是 x 上最近非常热的叫 flickbook, 一个无限像素的一个产品。那今天这期视频给大家介绍一下这个产品到底是什么,以及它的一些使用场景。 那现在看到的就是它的一个使用界面,我其实是提前录屏了,待会大家就知道为什么我要提前录好了,而不是实时演示。它的使用起来其实非常简单,上传你已经有的图片,还有一些输入内容去解锁。 这个是我们之前做好的一个图,它就是关于南京的一个旅游景点的介绍,包括有一些特色的小吃,它生成了一张图,你可以点击图中的任意处元素,它会根据点击的区域自己去研究对应的内容。然后呢它就会生成了一个关于夫子庙相关的介绍。 ok, 这时候如果你对图中的任何一个元素感兴趣的话,你可以再次点击。 比如这时候我点了一下那个饺子,它会开始研究饺子这个东西。好,对,它就会生成了一个饺子的详细图,这时候我才发现这个不是饺子, 这是锅贴,它研究的其实很细的,是尖角括号锅贴, ok 线有啥,它怎么做的?这些全部都是实时生成的,你没有给任何背景。对,你就给一个图,是的,他就要自己去学习,学习完了以后呈现给你。对,是的啊,然后我又点了一下右下角的醋,它就基于这个醋又给了我一个研究的成果。 可以看到它这里面它其实应该是带入了我上面这个画铺的上下铺的,不然它这边就不会是镇江香醋了,我这边会是镇江醋吗?然后呢,你可以看到这里面它对英文的文字的还原,还有图画其实非常的 都很好。对,质量很高,而且真的就一层一层的往你的逻辑下面一点点帮你去生成,这些东西都是实时生成的嘛?对,是的,就你没有给它任何背景材料,对吧?是的,我们来看下一个 case。 下一个呢,就是我去上面的输入框自己去输入一个感兴趣的解锁内容,而且这次我用的中文,我这边输入的是海贼王中那个路飞的船员有哪些人,然后这是他给我的结果,他现在其实这个版本他感觉他最近更新了个版本,他现在对于中文的输出也很好了。 曾经在刚出来的时候我就去尝试一下,他对中文是完全几乎是深层不了,可以看到他对中文的输出以及这个答案的正确度还是挺高的。而且是最新版本比赛,可以基于这里面任何一个人物,比如说索隆可以继续下钻研究,那可以看到他对于索隆的研究结果,武器是吧?对,是的。 然后这边我还尝试了一下,比如说在这个基础之上,我自己手动又去输入了一个那个内容,再去进行一个非画布内容的解锁,查的是索隆的招式都有哪些,基于刚才上了个画布内容。嗯,单独去解锁出来的 所有的内容它都是实时的,可以一层一层的帮你自动生成,然后对,你就算搜索的内容也自动能够出图的那种。对,现在其实看到的就是它的功能全貌了,这也比较简单嘛,非常简单,就是一个非常有巧思的一个产品,它改变了一些交互的方式。对,是,然后你可以看到它的创始人他的认为说法, 他就是想要尝试不用 html, 不 用代码去实现一个和格式化的实时交互的过程。他就是想要尝试在未来 ai 对 于格式化层面能有什么改变。因为我们现在 ai 最大的发力点是 呃代码的文字、图片和视频,但图片和视频其实并不是和人交互的,他是想着在系统层面能实现无限的实时的格式化,它的实现原理我们可以一眼就能看出来,它就是 点击一个区域,然后它用多模态模型对于这个区域进行一个内容提取啊,然后再基于这个提取内容进行一个深度的研究。对,再拿研究成果和它已有的一个纹身图提样式去生成图片, 其实它这个过程比较长,因为它里面全电路都是由模型来参与的,而且呢不可控性很高,就你点了以后它生成出来的什么结果是你不知道的,你也没法去控制的,除非你自己去固定的解锁。 所以呢,就他也没有让上传背景资料的地方嘛,他全部都是他自己从大博上要么就关键词解锁,其实他有点类似于把我们以前百度搜索的那种场景稍微呢做成了格式化。对,然后我觉得目前最好用的场景就是 如果你对什么内容感兴趣,就可以去尝试,去通过这个来去研究学习。比如说我正面想去去学习啊,战锤四零 k 有 哪些战团他给我的输出结果,他可以把一些文字的那种研究结果给你,帮你格式化。 ok, 感觉就是一个互动式的百科全书。呃,在网上有很多 use case 都是基于了教育本身的,比如说医学类的解剖的里面的器官一项拆解什么的,然后还有机械相关的这些东西。 对,我看到很多都是来自于教育的案,它这个东西现在是一个我觉得是个比较好玩的玩具,是个实际应用场景不多,可能你有给自己家里小孩玩玩还蛮合适的。还有人做旅游攻略啊什么的,非常慢。为什么本期要用演示视频而不是实际操作?因为他每一次点击生成这个结果的过程非常慢, 都要两三分钟。哦,就是它不实时,是不是?对,是的,它那个视频看上去都是实时的,你知道吧?对,是的,它那个演示 case 都是花花实实的,其实都是处理过。对,还有现在因为火了,所有人都在用它,而且它这个陈列路都是大模型参与的,所以慢慢。 ok, 就是 这个产品,可能就是只是现在 它的一个测试形态,就是网页这个。对对对,但只是它这个想法的实验,它未来可能并不是一个这样的一个网页产品,有可能是个系统。 ok, 这是个半成品吧?是的,我们要持续关注它一下。好吧, ok, 本期视频就这样,拜拜。拜拜。

哇,我想分享一个新的看到的 ai 工具叫 flipbook, 它还不是很成熟,但是很好玩呐。比如说我现在想让它生成一个青岛旅行的 citywork 地图,等一会它就有了。这个,呃,画风还蛮可爱的, 这里应该是默认都是手绘的画风,因为我没有写风格的 prompt。 呃,他还标了路线,然后显示了这边步行大概五公里左右,耗时三个小时,我们来看可不可以细划一下。 我想让他标一下每个地点的特色,然后从哪走到哪, 现在等待时间就很长,所以我说这个东西还不太成熟嘛,哎,我加速一下, ok, 现在他显示起点第一个在栈桥,然后去圣米尔大道堂,然后到青岛德国首都府旧址,这个在信号山那,再去登州路啤酒街啊,八大关风景区。他的中文显示好像稍微有一点问题。 看一下栈桥,可以点击上面的图,然后进到下一个图,这些都是实时生成的,我还是加速一下 这一页就进入到了栈桥。青岛的海上门户,这边还标了可以看海鸥的时间,一些简单的介绍,点进去,然后还能看栈桥这个回廊阁的内部, 他就很像一本可以无限展开的书,然后你对什么感兴趣,你就点他了解一下这个,看看涨潮的。这个就很有意思,你可以不停的去探索自己感兴趣的内容。 再去看一下圣米尔大教堂,他甚至还放了平面图,这个是我去玩玩也不知道的信息, 中文大概看得懂。 我们再来看一下这个玫瑰花窗, 哦,这些原来是象征神, ok, 他这个画好像不是特别写实,因为点进去的话又是另外一个图了, 这个可能是现在这个 ai 不 可控的地方吧。再看一下八大关这边,八大关这边他标注了 花石楼和公主楼两个主要的景点,然后简单介绍了一下八大关为什么叫八大关。然后这边的建筑风格,四季的看点,哎,冬天就没了,冬天这边可以看雪,景 点花石楼的话,你就可以看到花石楼的整栋建筑。这个画的还挺到位的,长得好像差不多哎。一些简单的介绍, 然后我们点进去看一下,哇,这个还有还给了一个抛面图,一层、二层、三层,这些介绍都没什么问题。 然后这个螺旋楼梯,呃,这个螺旋楼梯的特色也展示的很清晰,这边有海,这边看海的确不错,我觉得这个花石楼的楼主非常有品位,可惜他自己没有机会住。 我们来核对一下他的信息的准确度啊。这个是栈桥风景区, 我们把它几个地点按顺序标进去,看一下这条路线是什么样的, 哎,这个好远,这个啤酒街我也没有去过,它好像放在这一条 city walk 路线里面。不是很对,但是前面四个点看起来都还行。 这里显示的公里数是六点九公里,然后驾车是二十二分钟,可前面他预估的五公里还是差了一点呢, 没有那么准确,但是我觉得这作为一个探索的工具,它很有意思,可以让你不断地深入自己感兴趣的地方。那谁说 ai 的 世界其实就是魔法的世界,是一个考验想象力的世界了。

最近外网上出现了一个特别火的项目,叫 flypoop, 官网介绍说,这是一款完全按需实时生成的无限视觉浏览器, 它让你打开的每一个页面都是一张图片,点击图片中的任意内容就能生成一张新图片,对该内容进行更深入的探索。你看到的界面不含任何 html 代码、特定链接或表单字段。 整个网络在你的屏幕上只是实时生成的像素点。屏幕上的所有文字都是由图像模型以像素形式渲染出来的, 没有任何额外的文字叠加层。偶尔图像模型可能会把文字渲染的有瑕疵或是位置出现偏差。随着模型的迭代优化,这类问题会逐步改善。 图片中的信息来自智能网络搜索,与图像模型自身的世界知识相结合。内容偶尔会出现不准确的地方,但他仍是一个实用的信息起点,且大多基于线上真实数据。 你可以预期它的事实准确性与使用 chad、 gpt、 gemini cloud 这类大模型的水平相近。项目的开发者说,之所以做这个项目,是因为大家都说意图甚千言,可我们的屏幕上却大多被文字和彩色矩形指按钮、表单控件占满了。 开发这个项目是因为我们看到了另一种可能,那些被标榜为未来的文字堆砌界面和生成式 ui, 就 像用一根细吸管去触引整片智慧的海洋,体验极差。 我们想要一种充满丰富精美视觉效果的计算体验,为用户量身打造实时生成。我们平时看到的网页本身就是在展示一张图像,只是它是由浆画的代码和规则生成的,很难传递复杂细致的想法, 而 flipbook 彻底摆脱了这种限制。它的优势在于,无论用代码实现起来有多难,它都会找到最有效的方式向你传递信息。如果传递信息的最佳方式是一个词,一幅插画,或是一张照片级的渲染图,你看到的就会是那个样子。 现在你看到的视频就是官方提供的演示视频,画面非常精美。接下来我来实操一下。 首先打开官方页面,根据提示,要么在输入框输入文本,要么上传一张图片。这里我选择上传一张图片,开始选择一张毛毛喝咖啡的图片,然后点击图片上的任意位置慢慢等待, 可以看到生成了特别详细的科普信息,图片也很精美。 继续点击,可以无限下钻, 这里还有 type 导航,让你可以回到任意层级,大家快去试试吧!

大家好,今天是体验新产品的一天。最近 flipbook 很 火,这个网站想看什么东西,可以直接搜索, 后台会实时生成,点击之后可以无限扩展,我们看它这个例子,查巴黎旅游的攻略,点击巴黎圣母院自动扩展,有了地图可以订票,订票的同时可以看到巴黎圣母院的建筑结构,我们现在来上手体验。我想了解深圳, 请用中文给我讲解,可以看到它其实没有那么丝滑,深圳从渔村到全球科技枢纽,电子产业、信息产业、 新能源,中国的硅谷。那我点了最高楼,平安金融中心,然后他就会自动告诉我,平安金融中心与 cbd 核心,平安摩根大通、福田地下火车站。我去看看还有啥 电子信息吧,他这里介绍,点击任意的图片,你就能得到一个新的扩展的图片,他已经生成好了全球硬件,硅谷、 华强北电子第一街。中文有一些笔画不是那么好,看样子是用杰米莱的模型生成出来的,这是个摄像头,点进去看会有什么。深圳半导体挺好的, 不管后面如何延伸,它的主题就是最早输入的那个主题。我想象一下实现的技术路径。 ai 深图加图片理解,然后配上一些提示词, 比如说点了这个桥, ai 会生成提示词,图片中这个区域,它和前面的这些关系是什么?再根据查到的信息生成一张新的图片, 当然提示词会更复杂一些,他们下一步计划是让图片和视频深层的更加精确,包含更多的真实数据。就先介绍到这里,谢谢大家。

前端又被 ai 干掉了?不,这回可能是整个 ui。 这个叫做 flipbook 的 网页没有代码,没有 html, 但每个像素都能交互无数次,堪称一本无限流格式百科全书。 网页的所有像素都由 ai 实时生成,摆脱了传统浏览器的固定按钮,上传图片或者文字指令后,任意位置都能交互,生成的画面也会自动适应任何窗口形状,真正的万物皆可点。我们上传了一张建筑外部照片,它识别出了是上世纪六七十年代建筑风格的学生宿舍。 继续点击,还会制了可能的室内结构。虽然不太准,文字输入上眼睛之后,缔将、陆吴、昆仑宫阙哪里不会点哪里,单凭机器人照片也可以拆解结构细化的关节构造,虽然精度有限,文字部分仍会出错,但还是十分适合做视觉化演示的。 flipbook 把屏幕当做视频流,理论上能输出每秒二十四帧的一零八零 p 高清画面。但可想而知,这种交互必然是非常烧钱,比如我们的就没动起来,而且每个步骤需要等待半分钟左右。对此,主创也回应是 gpu 受限, 目前产品可免费使用。网友们已经操上心了,比如这玩意看着好像没法插广告,那这么干的话,恐怕老黄又要发财了。

给大家分享一款最近非常火爆的 ai 项目,叫 facebook, 它在 x 上面的浏览量已经是超过五百多万,点赞量也有两万多,也是被很多大佬转发的一款 ai 应用项目,包括阿登努卡帕西之前的特斯拉 ai 负责人。来,我们先搞清楚 facebook 是 咋玩的, 我们先点开它的首页,它有一个 demo 的 视频,很多人看这个 demo 视频的第一眼就被它深深的吸引住了,因为你会发现它里面的 sim 是 一个巴黎旅游的场景,然后你点开它的巴黎圣母院,它里面会有更详细的各种介绍,包括里面的这些小人在里面走门票啊,时间节点呀,以及 几点开门,几点关门呢,从哪些路线过去玩啊,都有非常详细的一个介绍。而且在这个 sim 视频里面,每一个你可以看到的点都可以再点开再次放大,它有很多层无限放大的这种 界面可以点开,我们现在来试用一下,例如我们搜索现在我们所在的城市武汉,我想更详细的了解这座城市的所有东西,我来点开。例如这座湖北博物馆, 你点开之后会发现这里面他是什么时候建好的,他大概的有多少年的历史,里面有哪些历史文物,包括这把剑,他的背景故事,他的历史有哪些?你还可以再点开详细的去看。 例如你就可以点开黄鹤楼,你可以看到黄鹤楼的历史,黄鹤楼的背景故事,以及黄鹤楼的开门关门,这种时间线全部都有,这给人的感觉就是我们小时候去看那种百科全书,但是它是可式化,并且可以交互, 你好奇哪些地方你就去看哪些地方,放在我们生活中也会出现一些场景,就例如你今天想去一个地方旅游,你没有去过这个地方,根据你自己的 形成规划,你之前可能需要在很多 app 里面去看攻略,去规划路线,去订机票。那现在你只需要做一件事情,提前先在这些界面里面去看好你要去的城市的一些景点,那你的景点那些详细的介绍,有没有你感兴趣的,有没有你想去的点 啊?根据这些点你再来判断说我要不要去这个地方玩,或者我要不要去这个地方,我要不要规划这个路线。这种交互界面会给人一种感觉, 那如果说所有的界面都是按照这样的一个需求去设计,那我们使用 app 的 概率就会降低很多。因为更多的这种格式化或者是各种界面,它才是符合我们人类对于一个场景的,或者对于我们这种定制化的需求。 很可能在未来这种交互界面,或者是这种交互的形式,以及这种格式化的形式会代替掉现在所有你看得到的一些 app 和交互界面。这是一个非常 神奇的体验啊,因为这种交互形式是跟我们使用 app 的 这种交互形式完全颠覆过来的。之前的顺序是 设计师和工程师预判了用户的需求,去做了一个固定的一个界面,用户在这个固定的界面去进行活动分离不可要做的是把这个逻辑反过来,用户的需求它是流动的界面也应该跟着你的用户需求去流动。 如果这个方向成立的话,未来你看到的所有的产品或者所有的应用 app, 它都会改变它的这种交互形式,它会随着用户的这种需求去流动。虽然这代产品它都是属于一个早期阶段,但如果说它的成本不高的情况下,它是完全可以颠覆和替换掉现在所有你看得到的应用 app。 应用产品的这种使用界面,包括这个创始人在自己的个人主页,他有说过一句话,机器应该来找人,而不是人去试人。机器现在很多 app 其实他已经在做,就是适应人的一个做法, 他在顺应人的人性去做。以及很多人看到这类的第一反应是质疑,会不会说这个产品啊,他消耗太多的头肯,他成本太高, 不支持所有人这样去做。当我们作为用户视角去看这类产品,一款是固定好的 app 界面,一款是随着你的需求而去可流动的交互式界面,你会更倾向于选择哪一种呢?

浏览器的未来可能根本就不是浏览器,这是 freebook 全球首个完全由 ai 实时生成的无线格式化浏览器,没有 html, 没有链接,没有代码,你看到的每一个字,每个画面全部都是由 ai 实时渲染成的像素,点击任何地方,它就会为你生成全新的世界。让我们直接上手来玩一下吧。 直接打开 freebook doc page, 我 们可以看到这个画板。我们先测试一下,比如输入英国大学分布图, 大概等待四十秒到一分钟左右,我们就可以看到他给了我们一张英国的地图,我们可以看到英国大部分的学校都在里面,但实际上学校的数量还是非常不全的。然后我们可以看到右下角这个红砖大学的砖字,这个中文显示也是甲骨文,甚至呢没有很好。 里面展现出了英国大部分的学校。然后我们随机点开一所试试看金三角名校与伦敦大学系统,他给了我们牛津大学、剑桥大学和 ucl 和 ic, 其实信息不是很准确,还有点优化,但是他的界面说实话做的还不错。 我们测试一下其他学校,他给了我们苏格兰古老大学概括,我也不知道他为什么要写古老大学,但是苏格兰的几所名校还是挺全的。格拉斯哥、爱丁堡、圣安和阿布丁。我们继续深挖一下,点开爱丁堡大学,哎,他直接给我们生成了这个奥斯丁堡校区的建筑, 然后周围是几个爱丁堡毕业的校友。我们测试一下格拉斯哥主校区的建筑模型,然后周围是两个校友。我们点开一个詹姆斯瓦特, 里面是对这个人物大概的一个介绍,效果还是不错的,但是很明显信息依然不是很全。目前使用下来,我觉得最大的弊端就是他可以显示很好的图片,但是他信息的展示相比于浏览器来说还不是很全,还有很大的优化空间。 接下来我们搜索一个问题, nba 球星历史排名,看他会给我们一个什么样的搜索结果。 ok, 这里的结果很有意思啊,它直接默认 michael jordan 是 goat, 然后 lebron, james 是 第二, 第三是贾巴尔,第四是 rachel。 其实这个还是不是非常精确啊,包括上面展示的数值,我也不知道是什么意思。其实作为一个看板来说,它还是非常糙的,但是我们今天主打就是一个试用嘛,因为这个产品也刚出,它的概念其实还是非常好,而且非常可玩的。我们点开 lebron, 看他会给我们什么样的生平介绍。 首先这个人物生涯待过的球队湖人、骑士、热火还挺全的,然后他的生涯荣誉,然后他的总得分啊,包括这个时间轴,他生成的信息是很准确没错,但是怎么说颗粒度实在是太低了,能展示的信息实在是太有限了。 然后基于这个勒布朗的肖像图,我们点开这个篮球看他会给我们生成篮球的介绍,还是和前面此条相关的一些信息。 这里我不知道他为什么给我生成了历史的得分榜,我不是很理解。呃,所以这个浏览器的逻辑性其实还有待提高。然后我们现在点击一下篮筐,看会给我们生成一个什么东西,是篮筐的介绍还是和了不知道相关那些信息?这里他把这个篮筐放大了,然后 左面是一个射程,右面是一个生涯数据统计,然后右下角不知道为什么他放了一个看板,是贾布尔的天勾勒布朗的强力突破和这个后射步展示的信息其实有点莫名其妙的,就是上下逻辑不是非常连贯,所以这个产品还有待优化。 总的来说, freebook 目前的状态还是非常粗糙的,但是它已经初步具备了一些世界模型的那种感觉了,还是非常具有未来感的。不知道大家对于这样的浏览器方式感不感兴趣,我也非常期待未来优化后它能达到什么样的高度。那么这期视频就到这里,这里是 bryce, 我 们下期再见。

我最近发现了一个特别好玩的工具,叫做 flipbook, 他 们把我脑袋里存的东西全部变成像素化,就像我一本私人的像素百科全书一样。 你们看,这是他出的演示视频,巴黎的旅游攻略。平时看照片可能没有感觉,但用这个像素风格做出来,就特别有那种复古游戏的感觉, 看着就让人开心。还有这个就是我做的厦门旅游攻略,从日光岩到南普陀寺,甚至连我最爱吃的沙茶面都能画出来。把攻略变成这种像素小图,不仅好看,我记景点路线都比以前快多了。 除了这些,我还发现了一些超厉害的点,我能让他直接把数学题也能变成这种像素风的插图,本来枯燥的题目瞬间就变成像闯关游戏一样,做起来有劲多了。怎么样,酷吧!我觉得不管是记知识还是做作业,只 要放进 book, 一 切都变成好玩了。你们有没有什么想变成像素化的东西?快去试试看吧,真的会打开新世界的大门哦!

毫无疑问,这本书即将颠覆整个教育领域。 sportify 创始人兼 ceo toby 都给到重磅评论, this is the beginning of something really big! 顶级的独立开源开发者、技术博主 simon wilson 评论,这很有趣,他们历见的就是这段时间火遍外网的 flipbook, 它运用 ai 技术,真正让学习从读一页书变成了走进一个世界。这也是人机交互方式的一次重大改革。 演示视频中, flipbook 通过动画的形式展现了巴黎的地标建筑,详细解析巴黎圣母院的建筑历史以及结构。实际用下来, flipbook 给我的体验只能用经验来形容,这简直是 ai 时代的魔法书,你可以问他任何你感兴趣的学科问题。主播在上海就查询了上海的地标建筑, 它能清晰的展示上海中心大厦的建筑结构,根据你的需求详细缠绵大厦楼顶的千吨阻尼器。工作原理。主播还用它查出语数机器人,它能迅速制作出语数 he 的 主要零部件分解 图,细化到工作原理和具体的参数。它能有这样的体验,核心在于从静态到交互的泛式转移。 技术原理上,它由多模态 ai 构建动态的知识全景,这不是简单的图文排版,而是 ai 深度理解内容后,自动构建知识的关联网络, 每个信息节点都能点击详细展示新的知识维度。主播输入我家可卡熊的照片,它能马上识别并转化成卡通版的百科,详细解读可卡熊的体貌特征,并且给到宠物的饲养建议。 在交互体验上,就像科幻电影第五元素中女主角学习单词的方式,从一个知识点出发,能无限延展出关联内容。传统学习是线性输入,从 a 到 b 再到 c, 而 free book 是 网状探索,从任意新起点可以切入,自由延展,每次学习的路径都不一样,把知识记忆变成了知识探索,让学习回归了它原本最吸引人的模样。 像淮海战役、四渡赤水这样的历史事件,它都能生成可式化的互动界面,把书本上枯燥的历史知识转化成生动可探索的动态页面。基于这样的体验和技术, free book 的 影响远不止于教育。我总结了三个核心的影响,第一,改变教育方式, 让定制化学习从概念落地为现实。过去因材施教只是理想,一个老师面对几十个学生只能统一节奏。而 free book 能让每个人的学习路径都不相同, ai 根据你的兴趣和节奏,毫秒级的深层知识延展方向不是替代老师,而是让千人千面的学习真正成为可能。 第二,改变孩子的学习习惯,从被动输入转向主动探索。传统学习是课本给什么学什么,固定范围,固定顺序,而 free book 是 你感兴趣什么,就从哪里开始探索。把我必须学变成我想知道更多,从而激发内驱力,这本就是教育最难的课题。 不仅如此, vbook 的 技术对课本上固定的知识可以进行多维延展,从一个历史事件,到它发生的地理位置,再到文化背景、关联人物,甚至是对今天的影响,把从固定的了解变成从兴趣切入,无限延展。第三,超越教育,重新定义产品的互动设计范式。 freebook 证明了任何信息展示性的产品都可以被重做。当前互联网产品都是千人一面,而用户看到的都是相同的页面布局,相同的信息顺序。 freebook 的 思路则是让每一个用户看到的信息排列、展示、深度关联、推荐都不相同, 它能放大用户感兴趣的部分,压缩不感兴趣的部分,定制化的浏览体验,这对内容平台、电商资讯 app、 企业知识库,几乎所有涉及信息展示的产品都有启发。由此我们可以得出一个核心洞察,未来的产品竞争不是功能的竞争,而是谁能更好的理解用户 并进行动态适配的能力。最后我想说,福利 book 让我看到的不是一个新功能,而是一个重要信号。 ai 正在从帮你解决问题,进化到帮你重构理解世界的方式。 教育只是第一个被改变的领域,相信用不了多久,我们接触信息的方式都会被这样的交互逻辑重新改写。我是卡卡,关注我,和我一起见证 ai 时代再会!

这两天 ai 圈有一个项目非常的火爆,叫做 flipbook, 这条帖子目前有近人的四百八十多万浏览,两万三千多个点赞,两万一千多个收藏。然后有很多的大佬进行了转发,比如说 andrew karpsy, 他 是之前的特斯拉的 ai 总监,包括还有 shopify ceo toby, 他 转发的时候还说了这么一句话, this is the beginning of something really big。 包括还有 chris 的 设计工程师 dan holly, 他的言论我们等会儿说, any, 我 先带大家看一下 flipbook 是 一个什么玩意儿。 首先我昨天是早上刷到这条帖子,然后一瞬间就被这个 demo 视频给吸引了,它展示的是一个见面巴黎旅游总览,巴黎的一些非常著名的建筑和景点,然后作者点击了巴黎圣母院,视频就 丝滑的放大了这个建筑,还进到了内部,还有些小人在里面走。有文字详细显示了就是巴黎圣母院的这个票价呀,还有可以看到什么样的东西,以及它的开放时间。作者在最后显示出巴黎市区所有其他的这个票价呀,还有可以看到什么样的东西,以及它的开放时间。作者在最后显示出巴黎市区所有其他的这些景点,你都可以一个一个点进去。 exit, 我 昨天还是 试用了一下,我在这个搜索栏里说我生活在泰国清迈,我想更多的了解这座城市,然后我就进入了一个,有一点漫长的等待啊,现在速度是比较慢,搜索之前其实还挺犹豫的,直到这张图生成出来以后,甚至它都还只是一个静态图,还没有用上动态功能,我就已经有点震撼了,因为目前在画面上看到的一切都只是 像素,就是 ai 实时根据你想要的东西,用像素来组成的一幅画,包括这些文字,没有任何的 html, 任何代码,都没有这个审美,我觉得挺好看的,就整个画面风格非常漂亮。我看到这里还有我最喜欢的太北食物咖喱面,然后我就 带着好奇点击了这道我喜欢的面,然后他就给我展示了一个非常清晰的结构图吧,汤底是什么?咖喱汤底,配有椰奶浆,然后这里还显示他的一些香料,包括这道食物的来源。好像我小时候在读那个百科全书的感觉啊,就是跟着好奇走, 然后我就脑子一想,我的天呐,如果这样的产品能够大规模化的话,现在的孩子不知道有多幸福。就是, 简直就是我小时候想象中哈利波特他们读书的感觉,就是书上的一切都可以动起来,然后你想了解什么,你就再详细了解,这是一本无限的百科全书的那种感觉。这个创作者的名字是 zhenshan, 看了一下他的个人主页,之前在三星待过,还有 open ai, 包括之前还通过 yc 孵化了他自己的一个创业项目, 然后我最喜欢的是他个人网站上写的一句话,他说 i help machines meet us where we are。 那 这件事真正意味着什么呢?我觉得就是大家目前使用的这些,不管是网页也好,还是 app, 对 吧?因为大家用的微信、小红书、抖音,你所看到的所有界面都是设计工程师提前设计好的,就是写好代码的,但是 flipbook 这样的产品出现以后,我觉得 未来现在的这些界面可能就不复存在了。就之前 a i 圈很多人说 app 可能以后就被替代了,我之前一直没有实感,直到我看到了,我就突然觉得这可能真的是以后会有的方向。就我们每个人 就只需要配置一个 ai, 一 阵配置一个你自己的。贾维斯,早上起来,如果我想要知道今天的天气,或者知道谁给我发微信,我没回,工作上有什么消息,有什么邮件,或者我想去哪里旅游,想生成一个根据我的 a i, 让他来给我实时生成一个界面, 根据我所要的需求。虽然这个产品目前是实验阶段,但它真的说明了一件事,就是我们目前理所当然所习惯的这些界面,可能在不久的将来就 被新的一种体验所代替掉了。比如说我看到创始人说了一句话,一张图胜过千言万语,我们的屏幕里目前装的全是文字和方块,而他们在通过 freebooks 想要搭建的是一个真正视觉化的体验, 不是预先设计师设计好的,而是专门为你专门为当下这一个时刻的需求而生成的实时体验。我觉得这个真的很有颠覆性。然后就想到我今天包括做这个视频里面的脚本,我刚刚跟大家讲哪些大佬在转发 这些不是我在呃社交平台上一条一条去找的,我只是刷到了 freebook 的 这条圆贴,然后我就把这个链接给到了我的 ai agent starchild, 在 我的 ai 助手上,我可以直接一键连接我的社交媒体 是我的 twitter 账号,然后他就可以拥有整个 twitter 的 信息,那这个时候我只需要就把链接给到他,然后我跟他说,我对这个话题很感兴趣,请你帮我看一下目前有哪些大佬转发支持或者不支持,或者大家目前对于这个是一个什么 感受,就给我一个非常完整的一个 report, 这个大概的脚本是 sara 今天给我做的,所以在这条视频的最后,我想用科斯的设计工程师 david 在 转发 flipbook 里说的那句话来结尾,他说以前我看到这种东西,第一反应是质疑,这看起来太漂亮了,非常不实际,因为, 呃,这背后代表他非常贵,非常消耗算力,肯定不会实际的应用在整个社会中。但是最近他一直在读写就是早期计算机历史的一些东西,就想如果现在我们 回到穿越到一九六零年,比如说问一个当时最聪明的工程师说,二零二六年,全世界的人口袋里都会有一个小盒子,这个盒子呃有千万像素的屏幕,里面装的储存量超过了你们目前六零年代所有的计算机的总核, 那那个工程师肯定是不会相信这句话的。但是在二零二六年的今天,我们的口袋里每个人都有一部手机,所以他说他想第一时间质疑这个 facebook 的 时候,他就突然意识到他可能已经不能相信自己的直觉了, 因为这几年 ai 发生了太多的变化,然后他这几年学到的一件最重要的事就是不能轻易相信自己的直觉,什么事情都有可能发生。 ok, 那 今天的视频就到这里,谢谢大家观看,我们下期再见。

五一假期来啦,你是不是还在用豆包 deepsea 生成文字版的旅游攻略?最近爆火的 flipbook 完全跳出了这种图文模式,一句话就能生成无限视觉的活地图,非常有趣,推荐给大家。 flipbook 是 一个网站,但是不是普通的网页,而是一种全新的视觉浏览界面。 大家有没有玩过塞尔达这款沙盒游戏,在地图范围内可以无限探索每一个岩石,每一片森林,后面都可能藏有没有见过的惊喜。而现在想象一下,这种无限视觉探索被应用到了网站浏览的体验中。先看一下 freebook 的 官方宣导片, 他展示的是巴黎旅游总览,点击图中的巴黎圣母院画面就丝滑放大,右边详细展示了去巴黎圣母院的交通票价、开放信息等,点击图中的任意位置都可以继续深入探索。我体验了一下,我在搜索栏中输入我五一假期想去中国深圳旅游。 freebook 的 所有画面都保持了这种统一的手绘风格,他先是展示了深圳旅游的大致信息,五一假期期间的天气,主要的旅游区域是南山、盐田和主要景点, 点击图中任意区域都是可以继续探索的。比如我们点击下面的区域地图界面就来到了深圳蛇口,就可以看到他介绍了海上世界的艺术馆、 音乐喷泉。那我们点击到推荐的菜系,就可以看到具体的餐厅,我查询了大众点评 flipbook 推荐的餐厅信息是准确的,这种交互感真的很妙。 除了旅游攻略,还可以问他湖南菜有什么好吃的,他就会告诉你,哎,有臭豆腐,有剁椒鱼头,有辣椒炒肉,你再点击臭豆腐,就还会有详细的讲解,真的很有意思。福利 book 的 无限视角探索,让知识获取的方式正在被改写,真的很有意思,推荐给大家试一下。

这才是我心中用 ai 驱动的网页! flipbook 彻底火了,它把网页都变成了 ai 实时生成的像素画卷, 你现在看到的每一个页面,居然全是 ai 渲染出来的图片。没有 html 代码,没有死板的字段,你点开任何内容, 它就会及时为你生成一张更深度的像素图。这感觉就像是在一个无限循环的电影里探索知识。它整合了最新的视频生成模型, 能把你浏览的静态图片变成流畅的动画过度。现在它还处于实验阶段,所以有点吃配置和小瑕疵,但这视觉冲击力和交互方式真的能让你眼前一亮。这种所见即所得的去代码化体验,是不是你心中未来网页的终极形态呢?想要体验的评论区留言关注我。哎,不落伍!

我以前一直认为用 ai 做旅行攻略是一个伪命题,直到用到了推特上,最近特别火,连卡帕萨特都转载的 flipbook, 我 才知道原来用 ai 做旅行攻略,结果交付的不是一个文档,而是可以实时互动的路书。看一下我跟他的交互。我端午节要去一趟欧洲,我跟他说让他帮我规划一个十一天的假期,起点是马德里,途经巴塞罗纳尼斯跟巴黎。 你看,他交付给我了一张这样的图,这个图啊,他给我规划好了这十一天,我第几天,第几天,应该在哪个城市是一个这样子的环形图,他标注两个城市之间如何乘坐交通工具, 比如说从马德里到巴塞罗那啊,他给我标注可以坐这个火车,一点开就会发现,他给你标注好了这个列车的名字。他的预定指南提前多长时间开票,分几种车次,全程行驶的时间,他这个预定指南写的不清晰,对吧?然后你还可以点开, 点开之后,他会告诉你这张票长什么样子,他会告诉你不同票价的等级对比,还告诉你能在什么 app 上能够买到这个票,且还告诉你这个座位在这个车厢里面选择的透视图啊,他还跟你说了重要提醒,可以预备车票,在闸机处扫描, 就是一个完全指南哦。你对这个地方可能有些地方不太懂,比如说我对这个 app 很 感兴趣,你就点这个 app, 它就给你一个这个 app 的 这个使用指南,有它的 ui 界面啊,然后在哪里是跳闸,然后包括你可以接受这个铁路变更的短信提醒,它都给你标注在这就非常的实用, 比如说我还想看一下座椅,比如说我想看一下黄色的这个座椅区域打开是什么样子的,我都震惊了,他思考了一段时间之后,他打开这个座椅,连它 usb 的 插口在哪里,他都给我标注出来了, 告诉我这个 usb 餐食,还有这个座椅的舒适度是什么样子的。就这种细节的攻略,我真的不知道该去哪查。他看我点开马德里,然后他给我推荐马德里这几天应该如何分布 其中。第三天他给我规划了一个美食之旅,哎,我点进去之后,他就跟我说说啊,马德里大概好吃的东西有哪些,然后这些是由什么组成的,你每一个都可以点进去,看是不是喜欢 在哪里吃,怎么购买,他甚至还给我规划了一个美食街啊,美食市场一样的地方。其实以前在社区工作的时候,跟周边的项目的小伙伴做过非常多次所谓的路书,吃喝玩乐的地图 啊,大部分是那种 h 五的承载版本。第一次打开这个 flybook, 我 真的震惊,这应该就是我脑海中想象的下一个时代的路书,一张地图,他帮你规划好行程,你点开哪里你都能知道他的最清晰的信息,甚至能给他加上营业时间,一键团购这样的功能。 虽然这个产品现在非常慢,就是一张图的加载,你点进去可能需要呃三十秒到一分钟,甚至有些信息我也不知道它是不是准确的,且它现在没有中文服务。但是我非常有信心,一旦它拎上一些所谓的功能和 c i, 它一定具有无限大的潜力,这才是活地图啊。我最近半年一直在做各种各样的新的海内外的 ai 产品的试用,都没有这个 aha moment。 今天这个产品的使用给了一个很强大的哈 moment。 我 以前一直认为 ai 做旅行攻略这件事情就是一个伪命题,因为你比较熟悉的去过的地方你不需要 ai 对 吧?你大概心里对他的什么地方有个比较大的了解,你去搜索就可以知道自己要去什么地方,吃什么东西, 完全陌生的地方,你更信不到 ai 了。我从来没去过马德里,让 ai 给我规划一个马德里的攻略,给我形成一个 pdf, 我是 不敢跟着他的指令走的,因为万一出了什么差错,我要负这个责任。 而 flybook 这种互动形式,其实就是把信息铺在人的面前,把选择交给人,这种交互形式其实比搜索高效,如果大家感兴趣的话可以去尝试一下。我真的觉得 ai 做攻略的时代,因为这个产品真的来了。

最近上网发现了一个比较火的软件工具,叫 flipbook, 号称革命性的软件,无限可化的未来。点进去试用了下,比如我查询中国新能源汽车产业现状,它会生成如下内容,点击红圈处的充电桩,它又会生成如下内容。 使用下来,我的感受是确实很新颖,相当于把目前 ai 生成的文字内容进行了图力化渲染,从而实现更直观的表达。 但是抛开体验好玩的目的,真正去用它会发现三个问题,一、它生成的图例包含的信息量反而比文字的减少了,除了有文字标注的地方,其他的图式并没有带来比文字更有意义的信息,反而因为是生成的,才会图让人怀疑知识的真实性。二、 它生成的图例看似直观,其实缺少了知识的结构性和层次性,有种把豆子撒到院子里的感觉,让人看的茫然,无从下手,好像什么都能点,又好像什么都不能点。 下图是我查询解放战争的过程的结果图。抛开英文的问题,你看到这个图例能清晰了解解放战争的过程吗?三、由于每页图例的知识点比较凌乱, 导致前后浏览缺乏理解的连贯性。浏览的多了,像在迷宫里行走,来路和去路都迷失了。信息的获取大致需要经过收集信息、整理信息到表达信息这几步。 信息表达有很多种形式,但核心目标应该是把复杂的东西简单化,让人看得一目了然,更容易理解。 flipbook 本质是信息表达的一种新途径,但其直观性我觉得是有争议的。如果借 flipbook 灵感去扩散,考虑是不是把 ai 生成的内容用 ppt 的 形式表达出了,会更直观。 ppt 中在有序的信息表达框架下,包含结构化和层次化的文字内容和表达数据的各种图标,也可以加入视频和音乐等各种形式的信息。 对于可以进一步深入浏览的信息,可以像网页中的超链接一样高亮显著显示,点击后可以生成新的 ppt 内容,这样也可以无限可式化信息。当然,可以想象其他更有效的信息表达方式。 flipbook 可能不适合表达复杂的或者过程性的信息, 而更适合表达静态结构化的东西,比如建筑物等地理目标。你看见它不是更迷惑,而是更清晰直观地看到它长什么样。 flipbook 比较有趣,更适合儿童去使用和探索。

下一代浏览器来了,没有网页,没有链接,没有按钮,没有尽头。你输入搜索词,他给你一张百科全书插画,画里的地方都能点,点进去继续探索。没有尽头,我输入智能手机各个部件, 我输入黑洞,我输入布达拉宫,连文字都不是,文字是像素画出来的。我点了画里的金顶。又一张新插画,我点了金顶下的经纬,还是新插画,没有尽头,根本停不下来了。这个东西叫 flip book, 前 openai 研究员做的,上线四天。上线四天,广泛传播,已经有人把它开源复刻了,丢到 github 上,自己可以部署。有人用它搜巴黎旅游景点,在画里直接买了圣母院的票,没有跳转,没有链接,在画里找到了圣母院的购票入口。 我盯着屏幕,沉默了三秒。浏览器诞生三十年,一直是网页套网页,这是第一次有人问了个不同的问题,如果屏幕上的东西不是代码渲染的,而是 ai 画出来的,会怎样?这个答案刚刚开始,你最想用它搜什么?评论告诉我。

就是说哪个建筑人看到这样的演示呢,还能走的动道啊?赶紧一块来看一下 最近非常火的这个 flip book, 大家有没有去玩一下,我真的被这个视频吃的死死的,然后呢我就去看了一下他这个网站,他算是一个无限的可视化浏览器,所以他所有的这看到的这些页面全部都是 图片渲染出来的,然后你可以不停的点击里面的任何内容,就可以看到一张更加深入的探索这个内容的一个新的图片。所以他完全不是像我们之前的这个网页的逻辑,比如干嘛呀什么之类的,就非常非常的有心意,非常有创意, 设计师的定向狙击,我称之为,然后这次我体验到了,我真觉得天呐,好有意思,就是 you never know what's going on, 开始给他输入的是 macao travel, 然后他就给我生成了一个这样的轴侧图,看到这个大三八牌坊我就很好奇,我就可以点进去,他就开始渲染下一张图了。其实你自己去体验的时候你会发现,因为他渲染确实是需要 一段的时间啊,所以它肯定比它的那个 demo 展示的会慢很多,那个是经过剪辑的嘛,然后我们就可以继续往下看了,出现了一个这个大三八的一个哨,然后我们可以看,比如说我就想去看一下它的这个平面, ok, 我 们再点往里点, 因为发现它真的是实时的在帮你渲染,而步步的可以让你去了解更多这个有意思的事情,真的这太神奇了, 确实是需要一些耐心,稍微等一下他的 ok, 我 们就可以看到他的这个 the lost interior, ok, ok, 哎,我不知道就是其他专业的人看到这样的图是什么感觉,就是我看到之后就是 我的建筑之魂,就是崛起,一个大崛起的动作。然后他还会给你介绍 ok, 之前它里面是什么样子的,这个是它没有烧毁之前的一个状态,这是非常非常 next generation 的 一种展示。

哎,这个 i 工具也太离谱了吧!输入汕头 city book, 直接给我生成了一整本城市画册。你们看,这就是最近在为往抽火的 flipbook 配置。来看看他给我生成的汕头,你看这个小公园,汕头的城市地表,老城区的灵魂,边上还有汕头邮政工具,一九二零年代的西式建筑超级出片。然后这边是 一碗热气腾腾的单层牛肉丸汤,他甚至给我画了一个完整的科普图,告诉你牛肉丸为什么要捶打三十分钟,为什么能弹下来,还配了灵魂蘸料,沙茶酱,这细节我一个汕头朋友都服了,带式,这只是开胃菜。你们知道这个工具最离谱的地方是什么吗? 他的内容是可以无限延伸的。我点了一下老油局的花岗岩,然后他给我打开了一个完整的建筑科普。花岗岩怎么采掘的?花岗岩为什么能防台风?花岗岩的矿物质成分是什么?常识是鹰黑云幕,再点一下,直接给我挖到地球内部了。 岩浆窟,七百度高温,岩浆怎么冷却形成花岗岩,然后构造台生侵蚀,最终变成建筑材料。一颗花岗岩地脉深处 火扇喷发,有没有超乎你对网页浏览的预期?你设想以后你看到的网站网页如何,都是为你私人实时定制的,会是怎么样?评论区留下你的高见,下集我们继续拆解爱!