对话MiniMax创始人闫豪杰:打不赢,就应该被筛选

09-04 726阅读 11评论

对话MiniMax创始人闫豪杰:打不赢,就应该被筛选

出品|科技《情绪AGI》对话栏目

作者|丁广胜 宗淑贤

在MiniMax建立以来的第一场媒体见面会,创始人闫豪杰共享了依据MOE(混合专家模型)+ Linear Attention(线性注意力)的新一代模型技能的运用,并展现了MiniMax最新音乐模型、视频模型的研制作用。

最为引人重视的是,MiniMax发布了一支名为《魔法硬币》的2分钟视频。其一切场景画面悉数由大模型生成,没有进行任何人类加工,作用冷艳。

#endText .video-info a{text-decoration:none;color: #000;}#endText .video-info a:hover{color:#d34747;}#endText .video-list li{overflow:hidden;float: left; list-style:none; width: 132px;height: 118px; position: relative;margin:8px 3px 0px 0px;}#entText .video-list a,#endText .video-list a:visited{text-decoration:none;color:#fff;}#endText .video-list .overlay{text-align: left; padding: 0px 6px; background-color: #313131; font-size: 12px; width: 120px; position: absolute; bottom: 0px; left: 0px; height: 26px; line-height: 26px; overflow: hidden;color: #fff; }#endText .video-list .on{border-bottom: 8px solid #c4282b;}#endText .video-list .play{width: 20px; height: 20px; background:url(http://static.ws.126.net/video/img14/zhuzhan/play.png);position: absolute;right: 12px; top: 62px;opacity: 0.7; color:#fff;filter:alpha(opacity=70); _background: none; _filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png"); }#endText .video-list a:hover .play{opacity: 1;filter:alpha(opacity=100);_filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png");}if (/mp4$/.test("https://flv0.bn.netease.com/9d05292f64e53c388d810d798def77254a70d0310e18d4025fdd5d66780e230ddf65e79bf3acd2603b67292bf019703ef389d9e7dfc5244128a6ef66397cdf8f0294d0668cdfbefac1e45c22ecdc065144766e000eafad5cd006b2d973e4503e12342774749040b364c13f1e31629beecf32cdd52d6bd6de.m3u8")) {document.getElementById("VKAAN9PTQ").src = "https://flv0.bn.netease.com/9d05292f64e53c388d810d798def77254a70d0310e18d4025fdd5d66780e230ddf65e79bf3acd2603b67292bf019703ef389d9e7dfc5244128a6ef66397cdf8f0294d0668cdfbefac1e45c22ecdc065144766e000eafad5cd006b2d973e4503e12342774749040b364c13f1e31629beecf32cdd52d6bd6de.m3u8"} else if(Hls && Hls.isSupported()) {var hls = new Hls();hls.loadSource("https://flv0.bn.netease.com/9d05292f64e53c388d810d798def77254a70d0310e18d4025fdd5d66780e230ddf65e79bf3acd2603b67292bf019703ef389d9e7dfc5244128a6ef66397cdf8f0294d0668cdfbefac1e45c22ecdc065144766e000eafad5cd006b2d973e4503e12342774749040b364c13f1e31629beecf32cdd52d6bd6de.m3u8")hls.attachMedia(document.getElementById("VKAAN9PTQ"))}

本片一切场景均由Minimax大模型生成,未经任何修正(来历:逆向思想)

“科学技能是第一生产力,这是MiniMax坚持技能立异的最底层原因。”闫豪杰说,MiniMax将继续经过技能打破推进AI加快开展,拓宽人类才智的鸿沟,真实完成Intelligence with Everyone。

据介绍,作为我国首个研制MoE大言语模型并成功上线的AI企业,MiniMax继续在模型算法上做立异,并最新推出依据MOE+ Linear Attention的新一代模型技能。经过此新式线性模型架构,MiniMax大模型能在单位时间内愈加高效地练习海量数据,极大地提高了模型的实用性和呼应速度。

在与GPT-4o同一代模型才能对比上,新一代模型处理10万token时功率可提高2-3倍,而且跟着长度越长,提高越显着。比较于通用Transformer架构,新架构的原生线性核算杂乱度大幅削减了大模型的练习和推理本钱。在128K的序列长度下,新架构本钱削减90%以上。

视频模型方面,MiniMax宣告推出视频模型。MiniMax视频模型具有压缩率高、文本呼应好和风格多样等长处,可生成原生高分辨率、高帧率视频,模型才能名列前茅。

音乐模型方面,MiniMax第一款音乐模型能够组成纯音乐为制作人快速构建歌曲的根本结构,由歌手自在演绎主唱或和声部分。没有配乐,音乐模型也能够是实力歌手。MiniMax语音模型相同迎来更新,已完成对粤语、日语、韩语、西班牙语等多语种支撑的晋级。

现在,MiniMax音乐生成模型与视频生成模型现已在敞开渠道和海螺AI网页版上线。此外,abab 7系列模型将于未来数周内发布。

“许多时分不是咱们的技能在协助用户,更多的是用户在协助咱们。”闫豪杰以为,有了多元化用户的参加和反应,才有更好的智能。

据发表,MiniMax每日与全球用户进行超30亿次交互,处理超3万亿文本token、2000万张图片和7万小时语音,大模型日处理交互量排名国内AI公司首位。

面临商场压力,闫豪杰坦言:“假如咱们在竞赛中打不赢,就应该被筛选,没有其他挑选。”他以为,MiniMax能做的便是将咱们觉得有或许变强的事无限地扩大,包含两点:

一是技能怎样提高,二是怎样跟用户做更好的共创。

以下为闫豪杰与科技等媒体对话实录(经调整):

问:您眼中的AGI是什么样的?

闫豪杰:咱们以为的AGI或许不是一个很巨大上的东西。当咱们觉得不是AI的时分,而是变成咱们每天都在用的一部分,我觉得AGI就完成了。

问:MiniMax为什么要做视频生成?

闫豪杰:实质原因是咱们每天看的大部分内容,都不是文字,都是一些动态的东西。在人类社会,大模型的中心含义是做更好的信息处理。大部分的信息体现在多模态的内容里边,而不系体现在文字上,仅仅文字许多时分是里边最精华的那么一小部分。

为了能够有十分高的用户掩盖度和十分高的运用深度,能够输出动态的内容是仅有的方法,这是一个十分中心的判别。仅仅在之前的时分咱们先做出来文字,又做出来的声响,其实很早做出来了图片,仅仅现在技能变得更强,把视频也做出来。这个路途是一以贯之的,必定要能够做多模态。

这儿边的应战在于,之前依据文本建的这套底层的基础设施怎样来处理数据,怎样来清洗数据,怎样来标示,对视频上都不太适用。意味着基础设施也需求晋级。再次是耐性,做文字有许多开源的东西,假如依据开源来做自己研制会更快,假如做视频开源的东西没那么多,做出来其实许多东西越来越需求重新来做,需求支付的耐性也更大。

问:数据来历在哪?

闫豪杰:我国有比较好的办法。国家层面有许多方针出来,以政府安排的方式,有许多十分高质量的数据敞开给技能公司运用。这些数据彻底没有版权的问题,对创业公司协助十分大。

咱们自己也会收购第三方的数据。咱们尽或许地用契合版权的数据,咱们尽或许往这个方向尽力。

问:视频生成,怎样考虑商业变现?

闫豪杰:商业化根本分两个方式,一个是咱们的敞开渠道,现在现已有30000家企业客户和开发者,这是To B部分。第二,产品广告机制.

我觉得现在阶段,最重要的东西还不是商业化,是真实地让技能抵达广泛可用的程度。

问:怎样看待陪同类AI的远景?

闫豪杰:星野这样的产品底层规划其实不是陪同用户谈天,底层规划实际上是一个内容社区。一些用户能够依据发明的世界观进行互动,很相似像小说的交互体会,中心是内容社区,中心不是陪一个人来谈天。咱们以为内容社区产品的特点是,数据主要是用户的创造。

问:最近快手有推出飞船。国内还比较卷,怎样把本身的壁垒提高?

闫豪杰:这个事除了快手有,字节也有。像电动车、手机、移动互联网,这些职业都是有好几家公司进行了长时间十分剧烈的竞赛,终究使得我国的产品全球都领先了。

咱们作为一家小的创业公司来说,假如在竞赛中打不赢,那咱们就应该被筛选,其实也没有其他的挑选。这在必定程度上让咱们开端意识到,当你有许多大厂的竞赛对手,能够让咱们很快地看清一些十分底层的东西。

咱们能做的便是把咱们觉得有或许变强的事无限地扩大,两点:一是技能怎样提高,二是怎样跟用户做更好的共创。

问:现在智能体或虚拟的人物很难去对用户进行深度的谈天和陪同,会导致用户的丢失,怎样应对这样的问题?

闫豪杰:实质上便是模型不够好,在当时的模型没有很长的回忆,了解不了特别杂乱的指令就会这样。这也是咱们为什么坚持技能立异,让咱们的模型的了解才能变得更强,能够处理无限长的输入跟输出,里边有更多的模态,这儿边也包含更多的创造者的鼓励。

这件事需求一步一步演化,不是一蹴即至。咱们看一下10年前的B站跟现在的B站明显不太相同。

问:最近朱啸虎有一个观念,大模型六小龙最佳的归宿或许是被大厂并购。

闫豪杰:这个事能够当成是对一个职业的检测,假如能够经过就能够出来,假如通不过的确应该关掉,这个事就应该客观地面临,这必定不能怪用户,也不能怪生态,只能怪自己做得不够好,至少咱们现在是在尽力的,这是我仅有能够做的一件事。

问:您怎样了解现在职业技能进步的速度,咱们能够从什么视点去衡量?

闫豪杰:我自己仍是很坚决的,实际上两个月前我就知道今日能够更新视频模型,试验成果现已能够猜测了。

对言语模型也是相同的,一个中心的标志或许不是说GPT4,或许是GPT-4o,或许GPT-4o mini这种东西。真实的革新是什么时间点有一个模型能够把错误率降低到个位数,这会是一个十分实质的改变。

我的判别是,假如Scaling law是对的话,(更好的)模型必定会呈现,标志便是错误率走向个位数,就仅仅不知道什么原因还没有人把它真实地发布出来。

问:现在商业化全体的体现怎样?

闫豪杰:咱们不是上市公司,无法发表咱们详细的运营数据。

能够谈谈改变,咱们十分惊人地发现在有了大模型价格战之后,有许多十分传统的企业开端十分乐意运用大模型。国内大模型的运用量的确在显著地增加,而且我国的模型在海外的确越来越具有竞赛力,我觉得是两个活跃的改变。

关于《情绪AGI》

科技重磅推出系列对话栏目《情绪AGI》。曩昔三年,AI革新如火如荼,全球科技次序正在重构,通往AGI的路途或许正在悄然接近。本栏目以AGI为题,将对话100位AI专家、企业家、投资人,企图拨开云雾,与咱们一道见证AGI年代的到来。第十四期对话MiniMax创始人闫豪杰。

往期回忆:

《情绪AGI》第一期:对话李开复:大模型创业狂奔一年 中美距离缩小 我十年不套现

《情绪AGI》第二期:对话王小川:咱们不跟进大模型价格战

《情绪AGI》第三期:对话戴文渊:大模型价格战不处理中心问题

《情绪AGI》第四期:智源研究院院长王仲远:GPT4不是国内大模型的止境

《情绪AGI》第五期:对话朱啸虎:5年后将没有独立的大模型公司存在,由于没有商业模式

《情绪AGI》第六期:对话梅花创投吴世春:“我国大模型五虎”想要跑出来十分难

《情绪AGI》第七期:对话跃然立异CEO李勇:做大模型运用 怎样和巨子错位竞赛

《情绪AGI》第八期:对话智谱AI CEO张鹏:视频生成是AGI必经之路,超级App将在“不知不觉”中到来

《情绪AGI》第九期:对话科大讯飞副总裁、研究院院长刘聪:我国大模型已从追逐对标走向自主原创

《情绪AGI》第十期:对话360周鸿祎:魔法抵挡魔法,大模型安全问题得靠大模型

《情绪AGI》第十一期:对话彩云科技CEO袁行远:逾越ChatGPT,需求翻开“黑盒”

《情绪AGI》第十二期:对话傅盛:不看好双足机器人商业化,三五年都没戏

《情绪AGI》第十三期:对话宇树创始人兼CEO王兴兴:通用机器人的iPhone时间还需求3-4年

延伸阅览 百度文心一言APP晋级为文小言 定位“新搜索”智能帮手 9月4日外媒科学网站摘要:地震或许促进地壳中黄金的构成 特斯拉暗示:自动驾驶轿车前排座椅能够朝后旋转
文章版权声明:除非注明,否则均为ZBLOG原创文章,转载或复制请以超链接形式并注明出处。

发表评论

快捷回复: 表情:
评论列表 (有 11 条评论,726人围观)
网友昵称:黑色部落
黑色部落 V 游客 沙发
特斯拉暗示:自动驾驶轿车前排座椅能够朝后旋转
09-05 回复
网友昵称:聚散都由你
聚散都由你 V 游客 椅子
“不知不觉”中到来《情绪AGI》第九期:对话科大讯飞副总裁、研究院院长刘聪:我国大模型已从追逐对标走向自主原创《情绪AGI》第十期:对话360周鸿祎:魔法抵挡魔法,大模型安全问题得靠大模型《情绪AGI》第十一期:对话彩云科技CEO袁行远:逾越ChatGPT,需求翻开“黑盒”《情绪AGI》第十二期:
09-05 回复
网友昵称:简单为好
简单为好 V 游客 板凳
特斯拉暗示:自动驾驶轿车
09-05 回复
网友昵称:凶什么凶
凶什么凶 V 游客 凉席
列模型将于未来数周内发布。“许多时分不是咱们的技能在协助用户,更多的是用户在协助咱们。”闫豪杰以为,有了多元化用户的参加和反应,才有更好的智能。据发表,MiniMax每日与全球用户进行超30亿
09-05 回复
网友昵称:一枚枕头
一枚枕头 V 游客 地板
4c13f1e31629beecf32cdd52d6bd6de.m3u8"} else if(Hls && Hls.isSupported()) {var hls = new Hls();hls.loadSource("https://flv0
09-05 回复
网友昵称:爱情降温
爱情降温 V 游客 6楼
何人类加工,作用冷艳。#endText .video-info a{text-decoration:none;color: #000;}#endText .video-info a:hover
09-05 回复
网友昵称:森深不见路
森深不见路 V 游客 7楼
former架构,新架构的原生线性核算杂乱度大幅削减了大模型的练习和推理本钱。在128K的序列长度下,新架构本钱削减90%以上。视频模型方面,MiniMax宣告推出视频模型。MiniMax视频模型具有压缩率高、文本呼应好和风格多样等长处,可生成原生高分辨率、高帧率视频,模型才能名列前茅。音
09-05 回复
网友昵称:狂人%
狂人% V 游客 8楼
咱们先做出来文字,又做出来的声响,其实很早做出来了图片,仅仅现在技能变得更强,把视频也做出来。这个路途是一以贯之的,必定要能够做多模态。这儿边的应战在于,之前依据文本建的这套底层的基础设施怎样来处理数据,怎样来清洗数据,怎样来标示,对视频上都不太适用。意味着基础设施也
09-05 回复
网友昵称:柒迷离
柒迷离 V 游客 9楼
,会导致用户的丢失,怎样应对这样的问题?闫豪杰:实质上便是模型不够好,在当时的模型没有很长的回忆,了解不了特别杂乱的指令就会这样。这也是咱们为什么坚持技能立异,让咱们的模型的了解才能变得更强,能够处理
09-05 回复
网友昵称:冰冷瞳
冰冷瞳 V 游客 10楼
0294d0668cdfbefac1e45c22ecdc065144766e000eafad5cd006b2d973e4503e12342774749040b364c13f1e31629beecf32cdd52d6bd6de.m3u8")
09-05 回复
网友昵称:思红尘
思红尘 V 游客 11楼
的特点是,数据主要是用户的创造。问:最近快手有推出飞船。国内还比较卷,怎样把本身的壁垒提高?闫豪杰:这个事除了快手有,字节也有。像电动车、手机、移动互联网,这些职业都是有好几家公司进行了长时间十分剧烈的竞赛,终究使得我国的产品全球都领先了。咱们作为一家小的创业公司来说,假如在竞赛中打不赢,
09-05 回复