随着ChatGPT以前所未有的速度火出圈,大模型也迅速从过去的遥不可及走到了我们身边。从今天开始,元碳院将开始解读大模型,依旧保持硬核且专业。今天是第二十五期,用于教育领域的大模型屈指可数,网易有道能否保持住十几年的“业界一哥”地位呢?
26日,网易有道举办了“Powered by子曰”教育大模型应用成果发布会。会上推出了教育领域垂直大模型““子曰””,并一口气发布了基于“子曰”大模型研发的六大创新应用:“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”、“文档问答”。
虽然最近大模型赛道逐渐趋于饱和,ChatGPT的流量也在下滑,但在AIGC重塑千行百业的共识下,教育行业自然也不例外,公司也期待大模型产品为业绩带来更大空间。网易有道CEO周枫在27日多次强调“场景拉动”的重要性, “一个好的技术有没有价值、能不能发挥巨大的作用,很多时候关键在场景和应用的选择以及细节的打磨。通过软件、硬件、AI技术的结合,做出精品是我们现在做的事。”
(资料图片)
“子曰”引领教育个性化浪潮
26号的发布会上周枫表示:“大模型的出现与应用,给教育行业带来的最大机会是助力因材施教。‘夫子教人,各因其材’,我们希望‘子曰’可以朝着这样的教育理想去做。”关于“子曰”“因材施教”的优势,周枫表示共有三点。
1.“子曰”能为学生提供个性化的分析和指导;
2.“子曰”能够实现引导式学习,与教师一样提出问题,并引导学生自行探索答案;
3.“子曰”具备全科知识整合能力。
通过连接多模态知识库、跨学科整合知识内容,“子曰”能满足学生随时随地的动态需求,帮助培养学生更强的综合能力。
相比同样用于教育的星火认知那种通用大模型,“子曰”是典型的行业或垂类大模型,主打的就是场景优先。 “子曰”作为基座可以支持许多下游任务,向下游场景提供语义理解、知识表达等基础能力 。同时也正是基于这种特点,网易有道在“子曰”的基础上,为不同学习场景设计了多种不同的定制化子模型,以尽力实现模型与场景的高度契合。按照周枫本人的说法就是 “我们的目标很明确,就是以实际的教育场景驱动,用技术创新助力教育创新;希望技术和产品的深度融合,可以根据学⽣不同能⼒和需求,提供因人而异的个性化教学。”
2008年时有道推出自研的国内首家统计机器翻译线上引擎。经过十几年不断发展,有道神经网络翻译(NMT)现在是行业领先的一哥,目前仅有道词典月活跃用户已经超过一亿,是国内词典翻译市场当之无愧的头牌。不过目前“子曰”的翻译功能仅限于中英文互译,限于成本问题还未开拓其他语种。
覆盖六种领域的创新成果
“子曰”在教育相关的多个场景中均有应用,覆盖翻译、作文、语法、口语、AIBox、文档问答共六种细分领域,充分展现了“子曰”在NLP领域的技术实力与教育领域的广泛应用前景,此外还有专用于英语口语练习的虚拟人教练Hi Echo 。在发布会的现场演示中,有道词典业务负责人与Echo进行了多组随机对话,Echo能很快理解场景和上下文,并及时给出反馈,而且像真人老师一样循循善诱,对话也能兼顾启发式引导,还能实时反馈。对话结束后,Echo会从发音、语法等维度提出修改建议,能很好解决长期困扰国内英语学习,特别是口语中不会说、不敢说、怕说错等问题。
场景驱动、技术赋能,有道不仅关注用户在英语学习中的痛点,还覆盖了多种学习场景,借助“子曰”的支持为用户提供多种高效学习方案 。比如Echo模拟的语境都非常贴合实际情况,可以帮助用户更好地练习英语口语。另外,位列六大成果之一的“AI作文指导”,不仅可以批改作文,还有指导写作功能,该应用旨在解决“学生不会写”和“老师时间紧张”的问题。针对学生在写作全程中面临的各种难题,如题目难以确定,写作主旨不明等,该应用都能够给予指导,帮助学生逐渐掌握写作技巧。在批改环节中,AI作文指导还会从表达、结构、内容深度、情感丰富度等维度全面提供改进建议。
大模型+教育
两个多月前的5月6日,科大讯飞发布“星火认知”大模型,并宣布大模型在教育等领域的应用情况。当天,科大讯飞董事长刘庆峰表示T20系列学习机在语、数、英等学科上进行了大模型应用落地,并说“我们希望更多的人能积极购买学习机,一定让孩子学习不走弯路。”一个多月后的6月18日,星火认知的各项功能逐步落地学习机、办公本等产品之后,科大讯飞表示今年再次突破高增速,并在多个品类中摘获销售额冠军,其中AI学习产品行业领跑,科大讯飞AI学习机系列获得京东和天猫双平台学习机品类销售额冠军。
将大模型运用到产品上增加新卖点,或许也是网易有道应对今年一季度智能硬件收入下滑的方法 。技术进步除了带来更好的产品,潜在效益也是各家公司入局大模型不能忽视的原因。网易有道素来以教育硬件见长,今年一季度在智能硬件业务上表现不够理想,营收为2.13亿元,比去年同期的2.53亿元下滑约16%。更雪上加霜的是学习服务端也在同时下滑,直接导致网易有道一季度营收12亿元,同比下降3.1%。而在营收下滑的同时,销售营销费用却增加近12%,网易有道今年一季度净亏损约2亿元。面对此情此景,哪家企业能不焦虑呢?
26日的发布会上,周枫表示对口语教练Hi Echo寄予厚望,因为国内的口语陪练有至少数百亿元的市场,对很多人来说是刚需。目前该服务采取会员付费制,不过比真人口语教练的花费更低。而基于“子曰”研发的六大创新应用,将会率先搭载在8月正式推出的AI学习机X20旗舰新品、有道词典笔旗舰新品中。此外,面对最近外部大模型市场上的一些变动,周枫显得颇为乐观,表示“世界上大部分的大模型都会是免费的,因为它的边际成本非常低,复制模型其实不需要成本。我们是非常拥抱开源的,有道以前也用很多开源产品,自身也开源不少项目,但我们做AI重点是应用落地,产品要让用户用起来‘丝滑’,之所以自己做大模型,是因为现有的大模型暂时不能满足需求,比如语法、答疑等。哪一天开源项目很成熟了,我们一定会用。”
虽然最近半年多大模型引起的浪潮将社会中的每个方面都裹挟着一起前进,但有的领域却始终特立独行,教育就是其中之一。 究其原因主要在于教育是主观性极强的行业,且各家大模型产品的质量也因为这样那样的原因而参差不齐 。虽然各家大模型普遍能说会道,但真正面对教育领域的问题时的表现却高下立判。今年高考时元碳院曾做过测试,用国内外五款主流大模型做十道高考数学题和写作文,最终的结果是即使是强如ChatGPT也只能做对约一半数学题,作文质量还不错,而这基本已经是目前业内最好的结果了。同时还有一些在发布会上自诩“先进”“一流”“弯道超车”者,结果却是数学题全错,作文没题目,内容也宛如流水账。之所以会呈现这种结果,除了训练内容与时间等差距外,还有部分原因在于数学更偏重逻辑思维,而目前大模型的运行本质还是概率采样,推理能力还没有取得实质性进展,更何况还有幻觉问题,这些困难的解决估计还需要付出多年的努力。 从目前来看,如果以更低的成本将大模型落地部署到具体产品上,改善消费者体验的同时带来更好的产品销量,或许这就是教育企业入局大模型的最大收获。
标签: