00:00 / 02:45
连播
清屏
智能
倍速
点赞9
00:00 / 00:41
连播
清屏
智能
倍速
点赞5
00:00 / 05:17
连播
清屏
智能
倍速
点赞13
00:00 / 02:08
连播
清屏
智能
倍速
点赞NaN
00:00 / 00:18
连播
清屏
智能
倍速
点赞157
00:00 / 03:41
连播
清屏
智能
倍速
点赞4
00:00 / 01:41
连播
清屏
智能
倍速
点赞84
00:00 / 01:55
连播
清屏
智能
倍速
点赞1
月之暗面Kimi爆火,AI语料库才是核心!AI语料上市公司 MOONSHOT月之暗面公司的Kimi助手取得巨大突破,无疑也得益于AI语料的不断训练。AI语料,即人工智能语料库(Al Corpus),是指用于训练和评估人工智能系统,尤其是自然语言处理(NLP)系统的一系列文本、语音或其他语言数据。 一、AI语料库 语料库里的数据可以是结构化的,也可以是非结构化的,包括但不限于书面文本、口头对话、社交媒体帖子、新闻报道、学术论文等。 二、中文数字内容 1、数据将成为如ChatGPT等AI大模型的核心竞争力,高质量的数据资源可让数据变成资产、变成核心生产力,AI模型训练的生产内容高度依赖源头数据; 2、ChatGPT的中文答案不准确主要在于目前中文语料学习库少,ChatGPT 中文资料比重还不足千分之一,为0.09905%,而英文为92.64708%; 3、中文公开语料远不足英文,这也成为大模型训练的痛点。大量高质量中文数据资源(包括政务、教育、商业、科研、商品等)尚未共享给国外大模型; 4、政策进一步重视国内数据核心资产建设,部分外国用户对中国大陆知识基础设施工程的访问将被限制,其中包括知网。 三、AI语料的重要作用 1、模型训练: 为机器学习模型提供必要的数据,使其能够学习和理解语言的结构、语义和上下文; 2、性能评估: 通过将AI系统的结果与语料库中的真实数据进行比较,可以评估系统的性能和准确性; 3、算法优化:可以帮助研究人员和开发者发现算法的不足之处,进而进行优化和改进; 4、应用开发:在开发特定的AI应用,如聊天机器人、语音助手、文本分析工具时,提供了丰富的数据资源,以适应不同的应用场景。 四、AI语料上市公司 相关标的一览表。 #人工智能 #ai #科技 #AI语料 #语料库
00:00 / 02:18
连播
清屏
智能
倍速
点赞15
2026年语言学南核选题聚焦数智融合、国家战略、学科交叉、理论创新四大主线,以下为覆盖核心领域的高适配选题方向 一、数智时代语言学前沿(高热度) AI与语言学范式变革:生成式AI对语言研究方法的重塑;大模型驱动计算语言学/语料库语言学创新;AI辅助语言研究的伦理边界 智能教育与语言应用:人机协同外语教学模式构建;AI个性化学习与教学评估应用;数智时代语言教师素养转型 二、语言政策与国家战略(高适配) 国家通用语言推广:推普的法理/学理/事理研究;多民族地区语言教育与社会融合;语言国情调查理论与实践 国际中文教育创新:国际中文教育标准建设;教材本土化与文化融入;中外语言政策比较与传播策略 三、语言本体与历史演化(稳中有新) 汉语本体研究:汉语句法/语义界面研究;新词语模生成机制;方言地理分布与演变(结合地理语言学) 历史语言学新视角:汉语历史语法演变的量化分析;濒危语言保护与数字化建档;典籍文献语言的计算分析 四、社会语言学与语言应用(接地气) 语言生活与治理:数智时代网络语言规范;媒体话语的语言策略与社会影响;政务新媒体语言传播效果 跨文化与传播:中国文学外译与接受;“讲好中国故事”的叙事创新;翻译伦理与文化适配 五、翻译学与语言服务(应用导向) AI与翻译创新:大模型翻译质量评估;译者与AI协同翻译模式;翻译技术伦理与版权问题 语言服务与国际传播:语言服务助力“一带一路”;行业翻译规范与人才培养;多模态翻译与跨文化传播 六、学科交叉与理论创新(新增长点) 交叉研究:语言学+认知科学/数字人文/神经科学;“新文科”背景下跨学科人才培养;语言与健康/法律/经济交叉 理论建构:中国特色语言学学科/学术/话语体系;认知语言学新范式;语言类型学与共性研究 《语言文字应用》:语言政策、语言智能、国家通用语言教育、语言生活治理 《外语研究》:AI与外语学科范式、跨文化交际、翻译创新、文明互鉴 《外语教学与研究》:理论语言学、二语习得、计算语言学、外语教育创新 《现代外语》:生成式AI与语言研究、语料库语言学、跨文化语用学 《语言研究》:汉语本体、历史语言学、方言学、语言类型学 《中国外语》:语言战略、国际传播、外语教育技术、翻译服务#南大核心 #语言学
00:00 / 03:04
连播
清屏
智能
倍速
点赞0