智东西
作者 | ZeR0
编辑 | 漠影
(资料图)
智东西8月27日报道,今日,国内大模型创企澜舟科技正式发布参数量400亿的孟子GPT-40B通用大模型、参数量70亿的孟子GPT-7B金融大模型,并推出基于孟子GPT大模型打造的会议内容分析平台澜舟智会。
孟子GPT-40B通用大模型现已开启邀测,中文能力更加突出,并兼顾多语言能力,无论是聊英文还是其他语种,都有同步的整体提升,语料均来自网页、百科、社交媒体、新闻以及澜舟科技与合作伙伴的一些高质量中文开源数据集。
产品服务面向企业用户开放免费试用。其产品服务有一个专门的导航栏,通过下拉菜单可体验澜舟科技的三款大模型。
孟子大模型面向企业提供从L1到L4的分级产品服务。基于孟子大模型可以快速搭建一个AI agent。比如用户输入指令,要求生成一家公司某季度业绩点评报告,孟子大模型会充当一个大脑的角色,快速分析用户指令,形成一个任务规划,并将该任务拆分成明确的执行步骤,将所有任务的结果展示在一个页面上,逐步形成一个完整的最终报告。
一、训练速度提升倍,评分提升10%~15%
基于FlashAttention高效注意力计算训练框架,孟子GPT-40B通用大模型的整体训练速度提升了倍,并基于TGI等加速框架,让推理速度提升倍。
其多轮对话理解更加智能和人性化,通用写作能力也更加优秀,写作风格更加丰富,支持报告、新闻、作文、营销文案、多语言文学创作、社交分享等各种文体,可以更加智能地遵从用户指令,并能做到与人类价值观对齐。
相比其第一版孟子GPT-7B大模型,孟子GPT-40B通用大模型整体评分提升10%~15%。
除了跟自家7B通用大模型比较外,澜舟科技也将孟子GPT-40B通用大模型与一些其他大厂及开源的大模型进行对比。其中ChatGPT的柱形普遍较高,澜舟科技的大模型目前还没能完全超越ChatGPT,不过在营销文案写作、多语言、文学创作、社交分享等分任务均表现出色。
二、 拆解行业大模型成功三要素, 推出孟子GPT金融大模型
澜舟科技今日推出的孟子GPT-7B金融行业大模型,是基于孟子GPT-7B通用大模型进一步训练而成的,结合自监督训练数据和100多个任务训练数据,针对金融行业所需的任务进行微调,搭配多个优化算法,从常见的微调上下文学习持续训练,最终再结合向量及索引,在一些应用场景中落地。
澜舟科技总结了行业大模型取得成功的三个关键要素,包括全、专、优的领域数据,高效的模型优化算法,以及应用场景的深度理解。
针对金融行业大模型,澜舟科技自己定义了一套评测体系,包括人工评测和自动评测,除了一些基础能力外,也涉及相关的行业应用场景评测。目前澜舟科技基于自建的评测集,针对金融写作摘要抽取新闻分类、文档阅读理解、公司名称等抽取事件元素,还有一些术语相关的金融行业任务,经过人工评测,将其分为三个层级打分,看它在各个得分的高分占比。
例如,某金融机构客户要针对内部的专业知识库,进行智能搜索与问答,其中会有很多非常有挑战性的任务。大模型不仅要具有金融行业的专业能力,而且需将企业的专业知识库及时有效地结合起来,通过将大模型生成的结果与企业索引获得的结果做组装,变成最后回复的内容,还会有一个检查器用来鉴别真伪,防止大模型胡编乱造,澜舟科技要做进一步的检测,最终实现一个构建全新搜索+AI问答的整体范式。
三、用大模型快速理解音视频会议,实现全文摘要和关键问答提炼
在实操层面,有些业务场景需要针对这些场景进行进一步的定制。澜舟科技基于孟子GPT大模型打造了一个会议内容分析平台澜舟智会。这是一个能够有效提高处理音视频会议效率的一站式平台,集成了文字转录、要点总结、会议纪要、话题聚合、文件管理等功能。
该平台有一个会议要点智能导航,可以自动提炼重要信息,并快速定位到相应的原文内容。针对全文语义搜索和问答,澜舟科技还对语音识别ASR进行了通过上下文对一些非标语法内容做纠正。
现场播放了一个演示视频,选择招商银行2022年业绩发布会文件,点击上传,即可一步实现会议内容文字自动转录。整体内容分为左、中、右三部分。中间开始部分显示全年的内容摘要,包括营收、利润、市场贷款等主要信息,接着是转录的全文详情,会自动识别参会人员及发言时间。
右侧是要点导航栏,方便用户快速了解会议内容大纲,对某个要点或者关键词可以快速定位。
左侧是主要功能区,展示了会议画面、参会人员情绪分析结果。总览会议关键词,可以看到每一个关键词的评述和情绪倾向。
借助澜舟科技孟子大模型能力和会议助手问答,点击聊一聊,问它今年银行的经营情况如何。
在侧边栏,会议助手给出了回答,并展示了回答的来源和对应时间,点击来源则会跳转到对应的上下文。孟子大模型支持会议内容自动搜索,例如输入招商银行的业绩如何,可以看到搜索到的会议以及有关段落,点击标段落则会自动跳转到相应位置。
结语:孟子大模型提供灵活多样的模型即服务
除了展示整体产品体系外,澜舟科技也分享了其孟子大模型提供的灵活多样的模型及服务(MaaS)。
在底层,全面拥抱主流的云平台、算力中心或者客户自建的算力中心,并在此之上提供不同规格的通用及行业大模型,为客户量体裁衣,随之会输出大模型训练框架/工具包。
在服务层,支持本地化私有模型、公有云专享模型、公有云共享模型、行业云共享模型等等,目前已提供推理服务,后续也将提供微调API相关服务。最后在应用层,面向金融、营销、文娱、机器翻译、企业服务等各行各业。