当前位置: 首页 > 关于智慧芽 > 最新动态

《联合早报》专访:智慧芽大模型的初衷是服务客户

智慧芽 | 2024-05-16 |

引言:日前,智慧芽联合创始人关典接受了全球知名华文媒体《联合早报》的专访,深入阐释了智慧芽垂直领域大模型的初衷与未来发展计划。

微信图片_20240516102040.png

以下是报道全文

文 | 李娅宁


智慧芽,一家由大学生创业项目起步的公司,获得软银(SoftBank)、腾讯等投资机构的青睐,发展成为估值超过10亿美元的独角兽,在生成式AI席卷全球的时代,它又急流勇进投身其中。

成立17年,以专利数据库起家,成为覆盖专利、生物医药、科创的数据服务平台,从一棵嫩芽到枝繁叶茂,智慧芽走过了很多重要节点。三年前,智慧芽刚完成3亿美元的E轮融资,跻身独角兽之列;如今,公司投资数百万元打造行业内首个AI大语言模型(Large Language Model, 简称LLM),加入生成式AI浪潮。

但智慧芽联合创始人关典接受《联合早报》访问时强调:“大模型是一种手段,而非目的。”

她也说,智慧芽做大模型的初衷,不追求酷炫的技术突破,而是服务于现有业务,让当前的科技创新平台更强大高效。

她举了利用大模型自动生成专利技术交底书(Technology Disclosure Form)的例子。通常,专业人士有一个技术创新的点子,大到工厂设备的控制系统、小到食品饮料的包装技术,想要申请专利,都需要先准备一份详细介绍发明创造技术方案的书面材料——技术交底书,才能请专利代理人撰写申请文件。

“以前,技术人员可能需要两三周去写交底书,现在,你只要把构思写下来,大模型就能一键生成。”

此外,大模型还可以根据交底书一键搜索相似专利、排查侵权风险、对专利进行估值等,大幅提升企业申请专利的效率。


纯粹为客户需求服务

关典强调,垂直行业的公司做大模型,并不是要与OpenAI、谷歌这些做通用大模型的公司去竞争,也不是争一个噱头,而是为了服务于客户的需求,这些需求是市面上已有的开放模型很难满足的。

首先是准确性的要求。

关典指出,智慧芽在专利、论文、科技信息领域已经有10多年的数据积累,而且这些数据并非杂乱无章,而是经过专家10多年做分类、打标签,数据质量本身非常好。因此,相对于ChatGPT等开放模型,智慧芽的大模型在这个特定领域的表现更为准确和深入。

另外,自研大模型也是出于客户对安全性和即时性的需要。“技术专利大都是敏感信息,如果用ChatGPT的接口,客户会担心信息泄露的风险。而且,大家都知道,ChatGPT训练的数据不是即时的,近半年的数据它可能没有,但我们自己可以做到每天更新数据。”

回顾17年的发展历程,关典表示,公司早在2014年就开始投入到“上一代的AI”如自然语言处理和图像识别技术。正是有了数年的技术积淀,因此当生成式AI时代来临时,公司才能快速建立一套质量较高的大模型。

这波浪潮确实让许多公司看到了变革的机遇,纷纷涌入其中。她认为,创业公司或者小型公司做通用大模型不太现实,在资源上无法与巨头竞争,但做特定行业领域的大模型却仍有很多空间和机会。


在任何领域,创新都是不能停下的

目前,智慧芽有50多位技术人员全职从事大模型,加上本身就“奢侈”的算力成本,公司对大模型押注很高。对于任何一家公司,高投入过后,商业回报是避不开的话题。

关典说,目前还没有具体的数字来衡量商业化效果,但大模型带来的价值是肯定的。“因为有了这些能力,我们跟竞争对手拉开了差距,客户可能更愿意选择我们的服务,愿意为我们的产品付更多费用。这是我认为的商业价值。”

她还说:“你不做的话,别的公司就会做,那你可能就会出局。在任何领域,创新都是不能停下的。”

AI助手