平时喜欢看我文章的小伙伴们肯定会知道,最近一两年中,我是给大家推荐了很多款语音转文字的软件,通过这样的软件的话,就可以把我们话筒收集到的声音转为文字,省去了键盘打字的麻烦。 最近这样的软件也是非常的多,我也是挨个的进行了尝试,然后先在电脑上除开 微信自带的那一个语音转文字的功能,都还有四到五款这样的软件。但是今天我还是要特别给大家来演示这样的一款,因为它真的是和别的与众不同,它的名字叫做灵感速记, 你看它的界面非常简单,和 win 十一的风格相类似,我们可以先来看一下啊,它的快捷键就是右边的 ctrl 键,是按一下就能够触发,不是长按, 那么其他的东西的话,其实就和普通的设置界面是一样的,那么他的主页的话就是一个统计,你可以看到我已经使用了四十九分钟的语音输入,输入了一万多字,说明我也是一个他的忠实的用户。 那么接下来我们就要来看一下他到底有哪些和传统的语音转文字有不同的地方, 比如我们打开一个需要输入文本的这样的一个软件记事本聊天框都是可以的,那么我们只需要轻轻的按一下右边的 ctrl 键,因为这个键的话其实平时用到的人是很少的,所以他考虑到这个键也是非常的科学按一下, 这个时候呢他就已经在收集我们的语音的声音了,但是他的文字不会实时的打在文本框里面,当我们再次按下这一个键的时候,我们就会发现刚才说的这些话转成了文字,但不全是原来的文字。你看 传统的语音输入法的话,就是一个听写员的一个作用,也就是我们说什么,他就把我们说的话全部转成文字,打在输入框。但是这一个就不一样,比如我们再来一句有一点点争议的这样的一个语音的内容。 大家好,下一周我们的会议就改在星期三,不对,星期四来召开,这样大家星期五就能够很好地去完成相应的工作。 哎,你看刚才在这个地方我们说到了一个星期三,但是在最终的文字里面却没有星期三这个字眼,这就是和传统的文字转语音不同的地方,看到了吗? 那么这一个文字输出的风格的话,其实和软件这边的设置有关系, 我们在这个地方可以来设置最终文字转出的一个风格,比如我们可以转成正式商务风,会议记录风,高情商的回复。哎,我们来测试一下这一个它是什么样的效果,我们把这边删除掉, 同样的按下 ctrl 键,也就是我们现在选择到了高情商回复这一个模式。好, 谢谢王总的关心,下次我会注意的。好,你看是不是他就稍微的加了一点点文字。在原来的基础上,我们也可以测试一下这样的一个朋友圈文案,这个比较感兴趣,然后试一下啊, 今天陪孩子一起去爬山,我感觉非常有意义。你看平时我们发朋友圈不知道文案怎么写,那么我们只需要把心里的想法说出来,那么就能够得到一个比较满意的一个文字, 下面还有很多这样的一个预制的风格,大家可以去尝试一下诗情画意版,我们再来试一试。 看到这样的风景,我的心情都好起来了,好,是不是 它会根据我们说的内容,然后来智能的优化输出的文本,这就是和传统语音输入不同的地方。最关键的是,我刚才在演示的过程当中,大家发现了吗?它的速度是非常非常的快,几乎是零延迟的,而这也是这个软件最关键的地方, 类似的软件其实现在已经不少了,但是很多地方需要很多软件需要自己去填写一个大模型的 api, 还有 嗯,那个 k。 那 么大家去填写的话,有这样的一个问题,要么就是你找到的这个接口非常的卡顿,最后得到这样的一个文本的话,需要花很长的时间, 最终大家都没有了等待他的耐心,要么就是你找到的嗯,那个 api 的 接口要么就非常贵,贵的话你最终的成本就非常的高,要么就是便宜或者是免费,那么最终他转换的效果就非常的差。所以 这样开箱即用的一个软件是非常值得大家,特别是值得一些新手去体验去使用的。好在这里还有自定义的一些。 嗯,风格,我们可以在这里面来设置一些自己平时用的到的,比如教师经常用到的怎么回复家长呀,或者是销售怎么回复客户啊,这样的一些风格都可以在这里面来添加。 好,我们接下来看一下它的一个翻译功能,在设置里面可以设置一个翻译附加键,也就是在传统的原来的 ctrl 键的基础上,再额外的多按一个键,触发一个翻译的模式。好,现在就是我们来测试一下,现在是按下 shift 键加 ctrl 同时按下,按一下啊,不是长按,这个时候下面的原色按钮圆形按钮变成了蓝色,就表示已经触发了翻译。我们接下来说的这些话啊,都会翻译成我们设定的这样的一个语言,说完了之后再次按下 ctrl 键, 刚才的那些文字全部都翻译成了英语,那么你也可以把它设置为翻译为其他的文本。 好,我们来测试一下现在的翻译效果。哎,是这样的啊,那么有的时候我们在开始触发语音识别的时候,忘了按下那个翻译的附加键怎么办呢? 比如这个时候我们就已经开始说话了,但是你看这个按钮是圆黑色的,那么这个时候你在结束的时候同时按多按下那个翻译附加键,也能够触发翻译效果。好,你看 现在同样是翻译的,看到没有,所以他给大家做了一个补救的措施,这是一个非常好的一个东西啊,然后其他的地方的话,大家可以根据自己的需求,然后去摸索一下。 那么这样的一个开箱即用的,刚才我已经说了,他比那种让自己来填写 api 的 要方便很多,你自己去填写 api 的 话,好用的就很贵,要么就很卡, 要么就是最终处理的效果没有这个好,最终你既耗了时间,又耗了金钱,最后还达不到这样的一个效果, 所以大家一定要多去试一试。这个叫做灵感速记的一个软件,前几天我也发文章对他进行了介绍,大家可以去看一看。
粉丝21.2万获赞78.8万

我们把超过八万人看过的 ai 语音输入法开源了,而他的主页是用其他的配置做的。前一段时间发了一个视频说我们做了这个语音输入法,然后那个时候在纠结说要不要开源,其实很多人吐槽,但我们现在开源已经有一段时间了,现在已经有一百多个 star 了。 这个产品目前其实只有最基础的 sr 功能,也就是云转文字,这也是上一个视频当中很多人吐槽的地方,说嗯,我们其实现在在规划两个新的功能,但都还没做完。一个是润色功能,就不会希望他在不同的软件中有洞房,用户根据场景进行润色。比如在 有写邮件的时候,自动帮助用户根据邮件的场景进行任色,如果在写代码的时候就按照代码的要求进行任色。另外我们也在考虑在这个云输入法的背后加入一个 ai agent 功能,我们就是使用 cloud agent sdk, 能不能 让用户通过语音执行一些操作。不过由于我们两个都是业余时间做这个产品,所以现在还没有明确的时间表,如果大家有兴趣的话,可以参与协助一起来开发这个产品。

新手福音,零成本启动,教你用手机拍出高质感 youtube 视频!你是否也梦想在 youtube 上拥有自己的频道?分享热爱,却总被专业设备太昂贵、制作流程太复杂的想法劝退?事实上,全球无数成功的创作者 正是从一部智能手机和零预算开始的。低成本制作绝非低质量,它代表的是一种高效聪明的创作者学。 本问将为你揭秘如何不花一分钱、冤枉钱启动并持续产出优质视频内容。核心装备,善用手边之物首先,请放下对专业相机的执念。你口袋里的智能手机拍摄技巧已经是目前最强大、最易得的工具。 确保拍摄前清洁镜头,并在设置中开启最高分辨率和帧率,如一千零八十 p 或四 k 六十 fps。 稳定拍摄是提升观感的第一要素。一个简单的自制手机三脚架,用几本书堆叠 或用夹子将手机固定在椅背上,就能彻底告别抖动模糊的画面。声音是视频的灵魂。相比相机内置麦克风,一副你已有的有线耳机,麦克风收音效果通常好上数倍。拍摄时尽量在安静密闭的空间进行, 让创作者的人生清晰干净。环境与光不花钱的视觉魔法。利用自然光拍摄是成本最低、效果最好的方案。 白天让你的拍摄对象面朝窗户,柔和的光线能自动磨平皮肤瑕疵,塑造出立体的面部轮廓,这就是所谓的面光。避免在单一的顶光如室内吸顶灯下拍摄,那会在眼鼻处产生难看的阴影。 一个提升质感的秘诀是自制反光板补光。用一张白色的卡纸或泡沫板将自然光反射到人物的阴影侧,画面立刻通透。专业后期制作免费工具的强大威力, 拍摄完毕,强大的免费剪辑软件是你的最佳伙伴。剪映国际版 capcut 和 devinci resolve 是 两款行业公认的利器, 前者在手机和电脑端都极易上手,自带丰富的滤镜、音效和字幕模板。后者则是好莱坞级的专业软件,其免费版功能已足够制作出电影感的视频。 学习几个关键操作,剪辑节奏把控、添加背景音乐、制作动态文字标题,就能让视频完成度飙升。内容策略可持续发展的关键。最后,低成本制作的核心在于可持续,初期切勿追求日更, 而应制定可执行的每周更新计划,专注于你真正擅长和热爱的领域,用真诚和有用的内容打动观众。一个清晰的手机视频封面设计也能在信息流中抓住眼球。你可以利用 camera 等免费在线工具轻松制作。 记住,成功的 youtube 频道始于第一个不完美的视频。从今天起,运用这些零预算视频制作技巧,将你的想法变为现实。阻碍你的从来不是设备,而是开始行动的勇气。

普通人学习 ai 需要遵循一个原则,这个原则可以让你对 ai 的 理解超过百分之八十的人,那就是看一手的 ai 信息,而不是二手信息。我觉得这个行业最前沿的一手信息都在路由器本上,关键是你要找到正确的信息源。 但是有人会说自己不懂英语怎么办?我也看不懂啊,这个很好解决,大家在自己的浏览器上安装一个叫沉浸式翻译的插件,就能解决你所有的语言问题。接下来我具体介绍一下怎么找,以及这些具体信息源的列表。 首先就是访谈大佬的视频播客,比如说硅谷最火的所有 ai 创业公司的 ceo, 他 们基本都会定期去上这些播客,去分享自己的创业经历或者做产品的经验。这些访谈一般都是在一个小时到两个小时之间,很多都是带有投屏和 demo 演示产品的, 真的信息密度非常高,非常值得刚入门的小白去学习。就比如说 lenny parker, 最近他访谈了 coco 的 创始人,你去看再多的 coco 使用方法,都不如去听听他的创始人亲口分享。一个半小时,他不仅会讲明白 coco 的 原理,还会亲自分享自己如何使用 coco, 这比任何的教学都更加权威和有用。第二类视频就是 ai 大 佬,他们经常会去参加一些活动或者大会上去做分享,这些活动基本上 youtube 上都有原版的录像,就比如说最近 yc 请了很火的大龙虾之父来进行分享, 这些信息是你在外面绝对接收不到的,因为 yc 真的 有足够多的大咖做分享,这些原版的视频 全部都在他们的频道里。第三就是 open v i 和 oppo 频的官方频道,每一次他们发了新的模型或者产品,我都一定会去他们的官方频道把原版的发布视频看一遍, 以及他们也经常会找自己的研究员或者团队成员去做一些分享。第四类就是手把手教你用 ai 工具的干货教程。我在网上发现一些大神,他们自己虽然不是特别有名的 ai 创业者, 但是他们非常擅长教,他非常擅长把一些复杂的技术概念用小白的语言讲清楚,然后真的是手把手一步一步教你去操作。所以我觉得如果是没有技术经验的同学,想要接触一些歪口点的工具啊,我非常推荐你看这几个博主。最 后我单独拎出来讲就是 angelica, 就是 想学 ai 的 朋友一定要关注他的频道,他的最大特点是 他既是技术出身,还可以把技术讲的通俗易懂。他也是 openmi 的 联合创始人之一,在 ai 领域造诣非常的深,所以我建议所有想学 ai 的 人,一定要把他的视频全部看一遍。

好,那我们把目光转向内容创作领域。 youtube 正在测试一项非常酷的新功能,它可能会彻底改变短视频,也就是 short 的 配乐方式。是的, 这个功能听起来就像是为下一个时代的内容创作量身定制的。具体是怎么操作的?创作者可以用两种方式生成独一无二的背景音乐。第一种是文字输入,比如一段忧伤的 sax 独读。对对对,就是这个意思。 第二种更直观,你可以直接对着手机哼唱一段旋律啊,直接哼?说实话,我有点怀疑,就我这种嗯五音不全的人哼出来的调子 ai, 他 真能懂吗?哈哈,你的怀疑很合理,最后,别给我生成一堆莫名其妙的噪音,哼。早期的版本可能确实会有问题, 但这背后代表的趋势是不可逆的,就是创作工具的意图化。意图化就是说,你不再需要学习复杂的操作软件,你只需要表达你的意图, ai 就 能帮你实现。这确实极大地降低了音乐创作的门槛。然而,这真的可靠吗? 技术总是在攻防里升级的,会不会很快就有新技术能绕过或者洗掉这个水印?这正是问题的核心。 sense id 肯定不是万无一失的,未来一定会有一场围绕 ai 生成内容的漫长的技术。猫鼠游戏。那 youtube 做这个的意义在哪呢?它在这里做的是主动为这个新生的领域设立一个初步的游戏规则。 他在向所有人传递一个信号,我们承认有风险,并且我们正在尝试借了一套技术标准来管理他。我明白了,他在利用自己的平台优势,试图定义 ai 时代的内容应该如何被标记和管理的行业规范完全正确。你看,这引出了一个经典的两难问题, 当 ai 能轻易生成音乐时,人类音乐家的价值何在?版权又怎么接定?是的,这不仅是技术问题,更是深刻的行业理论和法律问题。而 youtube 五通过推出这个工具和它的水印规则,已经成功的把辩论的框架给设定好了,这就是平台制定规则的力量。