数据和信息可以简单等同吗?答案是否定的。数据对应代码层上以0和1组合而成的比特形式,是信息的形式和载体;信息体现为代码符号所表达的具体内容。实践中,企业数据可分为以下两类: 第一种,叫“获得数据”。其本质是用户基于信任,授权让你临时保管的资产。对于该种类型的数据,企业只有“代管权”,而没有“所有权”。任何对数据的使用行为,都不能超越用户授权时“最小必要”的范围。一旦越界,性质就可能从民事违约,急剧恶化为“侵犯公民个人信息罪”的刑事犯罪。 第二种,叫“形成数据”。这是企业通过自身的算法、模型,对海量原始数据进行深度清洗、分析、整合后,创造出的全新数据产品。作为企业投入了智力劳动后产生的成果,企业对此享有更广泛的自用权和再授权。但这并不意味企业在使用该类数据的过程中就没有任何限制,若企业在加工处理的环节,违反了最初的授权约定,那么企业产出的“形成数据”,本身就不具备合法性基础。 不同类型的数据,对应了不同的数据规制要求。因此,在启动任何数据项目前,必须进行彻底的法律合规审查,这比任何商业模式的探讨都更重要,因为它决定了你的事业,是建立在磐石之上,还是流沙之上。 #数据权益#信息#爬虫#网络犯罪辩护#陈沛文律师
00:00 / 02:29
连播
清屏
智能
倍速
点赞10
00:00 / 02:04
连播
清屏
智能
倍速
点赞4
WJW2周前
人工智能三要素与方向 人工智能发展的核心支柱是数据、算法、算力,三者的关系可用生活场景生动比喻:数据是食材,算法是食谱,算力是炉灶,缺一不可,共同“烹饪”出各类智能成果。 具体而言,数据是AI的基础,其规模、多样性与准确性直接决定AI的学习能力;算法是核心指令,指导AI从数据中提取规律,自Transformer架构问世后,GPT-4带来算法范式突破,强化学习与OE推理让模型具备自我优化能力;算力是动力源泉,决定AI运行效率,英伟达的崛起印证了“算力即生产力”,当下大模型算力需求增速远超摩尔定律,呈指数级增长态势。 从数据维度看,大模型训练数据量已从2万亿token攀升至20万亿token,逼近互联网优质数据总量,合成数据因此成为新风口,有望催生百亿级创业机遇。 对于普通人创业,优先选数据方向,其次是算法应用层,算力不建议作为首选项。三大方向对比如下: - 数据方向:门槛低、资金需求适中,聚焦垂直领域数据标注、清洗、脱敏、合成,合规即可快速变现,长期深耕能形成独家数据资产壁垒。 - 算法方向:通用算法研发壁垒高,可依托开源模型做垂直场景微调,开发如AI招聘、智能客服等工具。 - 算力方向:重资产、强资源依赖,仅适合做运维、租赁中介等周边服务,天花板低。 数据方向落地可分三步:先做数据标注/清洗工作室,再聚焦垂直行业定制服务,最后切入数据治理与合成领域。需注意合规先行,聚焦单一行业做深做透,借助自动化工具降本增效。 结论:普通人创业,数据方向风险最低、回报最稳,从数据服务切入,再拓展算法应用,是更可行的路径。 #鲁大魔 #倒悬山
00:00 / 15:57
连播
清屏
智能
倍速
点赞2
00:00 / 02:26
连播
清屏
智能
倍速
点赞44
00:00 / 01:00
连播
清屏
智能
倍速
点赞2
00:00 / 00:36
连播
清屏
智能
倍速
点赞109