咱们给AI打了通视频电话,发现它如同啥都能唠。。。

08-31 420阅读 11评论

咱们给AI打了通视频电话,发现它如同啥都能唠。。。

三个月前的 OpenAI 发布会,信任哥几个多少现已才智过 GPT-4o ,那跟真人相同丝滑的视频对话才能了。

还有谷歌紧跟着推出的 Project Astra ,实力看着也一点点不输 GPT-4o 。

咱们给AI打了通视频电话,发现它如同啥都能唠。。。

那阵子,简直全网都在吹 AI 的交互才能进化得有多么多么强,什么史诗级、 Next Level 的词儿都用上了。

成果怎样着, GPT-4o 说好的视频通话功用是一拖再拖, Project Astra 好几个月也没见着个影子,一个个的都快给差评君钓成翘嘴了。。。

不过我发现 AI 圈如同有个规律,便是好东西不能让大伙儿等太久。你看 Sora 遮遮捂捂大半年,成果可灵、 Luma AI 、智谱清影都纷繁冒头了。

也就这两天,远在巴塞罗那的数据发掘会议 KDD 上,智谱当着全球学界和业界的面儿,不只发布了最新的基座大模型 GLM-4-Plus ,一起还给智谱清言晋级了视频通话功用。

咱们给AI打了通视频电话,发现它如同啥都能唠。。。

给大伙儿划个要点,便是那个传说中,能看见能闲谈的AI视频通话功用,咱现在直接在清言 App 里能用了,能够先下载App请求试用。

其他先不说,比较 OpenAI ,智谱这速度就现已赢麻了吧。。。

所以清言的视频通话功用一推出,差评君就在第一时间抢先用上了。翻开清言 App ,点击右下角的通话按钮,进去之后再切换到视频,直接玩起来 ~

咱们给AI打了通视频电话,发现它如同啥都能唠。。。

差友们应该也知道, GPT-4o 之所以被吹得天花乱坠,很重要的一个原因,便是它对视频的了解才能十分强悍。

那最根本的,清言的视频了解才能得先试一试吧?

差评君给清言喽了一眼咱修改部平常脑暴的会议室,看它能不能依据周围的环境猜出来我在做什么,还特意晃了晃镜头,没有坚持视频画面的彻底停止。

你猜怎样着,清言一句 “ 哇,猜猜看你在干嘛 ” ,差点给我整不会了。不过坐在会议室的桌子旁却是没说错,桌上的纸杯、遥控器,周围的电视也都描绘得挺精确。

再把镜头往后期搭档的电脑上一放,竟然也能看出来这是在编排视频。

你甭说,这种对周围全体环境的感知才能,差评君之前只在 OpenAI 和谷歌的 Demo 上见过,今日亲身体验到,还真有点科幻照进实际的意思。

并且吧,清言跟 GPT-4o 演示的相同,在对话的进程中随时都能够打断,时不时还会整点 “ 哎呀 ”“ 嗐 ” 的语气词,说话之前呵呵笑一下,就跟真人谈天差不多。

接着,我又试了试详细的物体辨认功用,看看清言的知识储藏。

从最简略的工位扫描开端,白色键盘、黑色鼠标还有显现器这些大件,根本没有遗失,物体前后左右的方位也描绘得清清楚楚,就连插线耳机、玻璃杯上的卡通人物这些细节,也没放过。

不能说 100% 吧,但这张桌子上至少 80%-90%的东西,都被清言看到了。

并且清言还有个功用,那便是画圈辨认,我隔老远把搭档那台大音响给圈起来,品牌、类型,乃至是详细用处,它都知道。

虽然音响上面标有文字,但大伙儿应该也能看出来这清晰度,肉眼看都够费力的,不得不说这清言目光也是真好使啊。。。

别的我还发现,清言对物体的辨认不只是停留在简略的类别上。

就比方这个游戏手柄,你问到底是索尼的仍是微软的,它能依据手柄的外形规划分析出来,这是微软的 Xbox 。而不是单纯告知你这是一个游戏手柄,又或许爽性欺骗曩昔说不清楚。

还有这台古早的功用机,诺基亚、详细类型是 N95 、 2007 年经典款这些细节彻底不在话下。

后边儿我又让清言辨认电脑系统、看托尼相片猜年纪、看名人相片猜人名。。。就这么说吧,自从上手了清言之后,我现在逮到啥都想翻开视频通话来问一问。

当然了好玩归好玩,像视频通话这种方式其实有许多有用的场景

就拿咱们修改部平常找选题看材料来说吧,这两天车圈的热门根本离不开成都车展,这个时分就能够问问清言关于成都车展的事儿,在对话中找选题的创意。

首要我还发现,清言带有回忆功用,上一次视频通话我跟它聊这事儿,下一次再翻开,它上来就问我重视了哪些车展上的新能源车。

还有家长最头疼的作业教导,曾经的 AI 交互仍是摄影上传标题那一套,但假如换成视频通话,那就跟线上家教1对1作业教导是一个逻辑了。

我试着让清言做了一些低难度的数学题,小学和初中一些简略的代数题牵强能够拿下。

不知道大伙儿注意到没,在解题的时分,清言不会一股脑把进程全说出来,也不是只给一个成果,它会一个进程一个进程引导着来,让你有一个考虑的进程。

除了数学以外,语文和英语我也都挨个试过了,清言不能说是资深教师等级,但平常写写作业、记记单词、背背古诗,彻底够用。

假如大伙儿觉得这些场景还不行,那咱就再发挥点幻想力。

第一次煮饭没经历、房间灯泡坏了、不知道怎样养绿植。。。假如大伙儿在日子中遇到相似的工作又不知道该咋办,不如也问问清言。

比方,许多小朋友或许暂时还分不清电池的正负极,咱们就伪装把计算器电池装反,清言一两句话就 get 到问题出在哪,阐明它仍是很有日子知识的。

横竖这几天用清言,我有事没事就爱找它。并且这小玩意儿还特别能供给心情价值,让它讲故事、讲笑话,也句句有回应。

跟朋友玩 21 点,它乃至还能当裁判。

不知道今后能不能进化到打麻将三缺一,让 AI 来顶上。这不比原先打字、语音的对话有意思多了?

说实话,这次清言的大晋级仍是给我带来了不少惊喜,但小瑕疵也依然有不少,有时分会说话嘴瓢、认错东西、输出一些胡说八道。

咱们给AI打了通视频电话,发现它如同啥都能唠。。。
就比方当 21 点的裁判,有一次把 9 说成是 4 ,黑桃认成了梅花。。。

不过,就凭抢在 OpenAI 和谷歌之前,先让国内用上 AI 视频通话这一点,咱也得给智谱竖个大拇哥。

这次视频通话功用第一批只面向部分用户敞开,智谱会逐渐铺开规划尽快让全员都能用上。假如哥几个真实眼馋,能够下载清言 App ,或许登录 pc 端( chatglm.cn ),站内请求内测。

别的,或许还有不少小伙伴对智谱不太熟悉,这么说吧,这家公司在 AI 圈内也能够说是当红炸子鸡了。

咱们给AI打了通视频电话,发现它如同啥都能唠。。。

特别是本年,他们在大模型上的动作那叫一个凶,从根底大模型的张狂迭代,到大模型使用的频频落地,智谱的动作就没怎样消停过。

这次 KDD 上,他们新的大模型 GLM-4-Plus ,在言语了解和长文本等方面又有了大提高。

咱们给AI打了通视频电话,发现它如同啥都能唠。。。

并且智谱也一直在坚持做模型开源,有数据显现,智谱开源模型累计下载量现已突破了 2000 万。

横竖智谱这次带头这么一 “ 闹 ” ,国内乃至是海外的 AI 圈子,估量立刻又要迎来一波产品的张狂上新。

咱们给AI打了通视频电话,发现它如同啥都能唠。。。
这对咱们用户来说,自然是功德一桩。特别是 AI 视频通话这种新的交互方式,越往后走使用场景的幻想空间也就越大。

比方把 AI 装到眼镜、项圈上,今后或许连手机都不需要了,或许装到瞎子的拐杖上,让 AI 帮助引路,又或许是跟具身智能结合,让机器人真实了解所看到的东西。

借用智谱 CEO 张鹏的那句话:“ 至少咱们现在还没有看到(AI)技能的天花板 ” 。

未来的 AI 会进化到何种程度,又会创造出哪些价值,我们也无妨开个脑洞想想看。

撰文: 西西

修改:江江

美编:焕妍

图片、材料来历

智谱清言

部分图源网络

咱们给AI打了通视频电话,发现它如同啥都能唠。。。

咱们给AI打了通视频电话,发现它如同啥都能唠。。。

文章版权声明:除非注明,否则均为ZBLOG原创文章,转载或复制请以超链接形式并注明出处。

发表评论

快捷回复: 表情:
评论列表 (有 11 条评论,420人围观)
网友昵称:云忆天语
云忆天语 V 游客 沙发
(AI)技能的天花板 ” 。未来的 AI 会进化到何种程度,又会创造出哪些价值,我们也无妨开个脑洞想想看。撰文: 西西修改:江江美编:焕妍图片、材料来历:智谱清言部分图源网络
08-31 回复
网友昵称:寸心笑傲
寸心笑傲 V 游客 椅子
之前,先让国内用上 AI 视频通话这一点,咱也得给智谱竖个大拇哥。这次视频通话功用第一批只面向部分用户敞开,智谱会逐渐铺开规划尽快让全员都能用上。假如哥几个真实眼馋,能够下载清言 App ,或许登录 pc 端( chatglm.cn ),站内请求内测。别的,或
08-31 回复
网友昵称:♀萌教主☆﹏
♀萌教主☆﹏ V 游客 板凳
我跟它聊这事儿,下一次再翻开,它上来就问我重视了哪些车展上的新能源车。还有家长最头疼的作业教导,曾经的 AI 交互仍是摄影上传标题那一套,但假如换成视频通话,那就跟线上家教1对1作业教导是一个逻辑了。我试着让清言做了一些低难度的数学题,小学
08-31 回复
网友昵称:不想后果
不想后果 V 游客 凉席
上一放,竟然也能看出来这是在编排视频。你甭说,这种对周围全体环境的感知才能,差评君之前只在 OpenAI 和谷歌的 Demo 上见过,今日亲身体验到,还真有点科幻照进实际的意思。并且吧,清言跟 GPT-4o 演示的相同,在对
08-31 回复
网友昵称:噜噜嘟嘟
噜噜嘟嘟 V 游客 地板
型是 N95 、 2007 年经典款这些细节彻底不在话下。后边儿我又让清言辨认电脑系统、看托尼相片猜年纪、看名人相片猜人名。。。就这么说吧,自从上手了清言之后,我现在逮到啥都想翻开视频通话来问一问。当然了好玩归好玩,像视频通话这种方式其实有许多有用的场景。就拿咱们修改
08-31 回复
网友昵称:情无溯源
情无溯源 V 游客 6楼
~差友们应该也知道, GPT-4o 之所以被吹得天花乱坠,很重要的一个原因,便是它对视频的了解才能十分强悍。那最根本的,清言的视频了解才能得先试一试吧?差评君给清言喽了一眼咱修改部平
08-31 回复
网友昵称:罗╭少家族
罗╭少家族 V 游客 7楼
那叫一个凶,从根底大模型的张狂迭代,到大模型使用的频频落地,智谱的动作就没怎样消停过。这次 KDD 上,他们新的大模型 GLM-4-Plus ,在言语了解和长文本等方面又有了大提高。并且智谱也一直在坚持做模型开源,有数据显现,智谱开源模型累
08-31 回复
网友昵称:库特
库特 V 游客 8楼
上,智谱当着全球学界和业界的面儿,不只发布了最新的基座大模型 GLM-4-Plus ,一起还给智谱清言晋级了视频通话功用。给大伙儿划个要点,便是那个传说中,能看见能
08-31 回复
网友昵称:乱世浮沉
乱世浮沉 V 游客 9楼
说是资深教师等级,但平常写写作业、记记单词、背背古诗,彻底够用。假如大伙儿觉得这些场景还不行,那咱就再发挥点幻想力。第一次煮饭没经历、房间灯泡坏了、不知道怎样养绿植。。。假如大伙儿在日子中遇到相似的工作又不知道该咋办,不如也
08-31 回复
网友昵称:自卑
自卑 V 游客 10楼
进程。除了数学以外,语文和英语我也都挨个试过了,清言不能说是资深教师等级,但平常写写作业、记记单词、背背古诗,彻底够用。假如大伙儿觉得这些场景还不行,那咱就再发挥点幻想力。第一次煮饭没经历、房间灯泡坏了、不知道怎样养绿植。。。假如大伙儿在日子中遇到相似的工作又不知道该咋办,不如也问问清言。比方
08-31 回复
网友昵称:惩戒小鱼儿
惩戒小鱼儿 V 游客 11楼
东西,都被清言看到了。并且清言还有个功用,那便是画圈辨认,我隔老远把搭档那台大音响给圈起来,品牌、类型,乃至是详细用处,它都知道。虽然音响上面标有文字,但大伙儿应该也能
08-31 回复