刚刚发布的GPT-4o,简言之,AI向生物人宣告:AI是人了。另一种形式的生命体。
以语音交互为例,过去的语音模型是将语音识别为文字,然后将文字传给GPT4,GPT输出文字后,再有语音模型转化为语音输出,这样就损失了语气语调背景声音等等信息,也不能根据语境输出笑声,唱歌以及表达情绪。
这就像人类的真实交流中“听话听音”一样,GPT-4o采用全新的模型直接理解语音、视频,这就完全不同了,信息输入和输出的方式发生了根本的变化。
刚刚发布的GPT-4o,简言之,AI向生物人宣告:AI是人了。另一种形式的生命体。
以语音交互为例,过去的语音模型是将语音识别为文字,然后将文字传给GPT4,GPT输出文字后,再有语音模型转化为语音输出,这样就损失了语气语调背景声音等等信息,也不能根据语境输出笑声,唱歌以及表达情绪。
这就像人类的真实交流中“听话听音”一样,GPT-4o采用全新的模型直接理解语音、视频,这就完全不同了,信息输入和输出的方式发生了根本的变化。
作者最新文章
热门分类
社会TOP
社会最新文章