发布于: 2023-12-7最后更新: 2024-1-16字数 00 分钟

跟踪AGI的进展,主要是我自己感兴趣的。
之前GPT第一阶段爆发后琐碎的新闻和新应用太多(大部分应该很快消失),所以第一阶段记录一段时间放弃。但是里程碑式的、振奋人心的记录还是有记录的必要,过几年看一下自己的合订本还是很有意思的。固开此篇,以INTERESTRING为题,就是振奋人心的新消息,肯定让我有动力记录吧(不摸了)。
当前本人的AI库(排名不分先后,收藏夹而已):
模型:
  1. Bing AI: bing.com/search?form=MY0291&OCID=MY0291&q=Bing+AI&showconv=1
  1. ChatGPT(可恶,没有plus,也没有gpt4-turbo内测): New Tab (openai.com)
  1. 讯飞(国内用过一段时间写文本,还不错):xinghuo.xfyun.cn/desk
  1. claude(poe里写文章偶尔用):New Tab (claude.ai)
  1. 谷歌家(争气点):bard.google.com/chat
平台:
  1. poe(唯一最爱,不过似乎没有暂时集成谷歌家的意思):New Tab (poe.com)
AI应用(可能有点过时了):
  1. 生成PPT:登录 - MindShow,让想法快速展示
  1. 读PDF(被模型直接淘汰了都):chatpdf.com
  1. 金融数据:New Tab (finchat.io)
  1. 科研:consensus.app/search/
  1. 绘图:miaohua.sensetime.com/zh-CN/generate

NEWS

Gemini-12月7日

  1. 官网:Gemini - Google DeepMind
  1. 官方blog:Introducing Gemini: Google’s most capable AI model yet (blog.google)
  1. 报道:谷歌深夜放复仇杀器Gemini,最强原生多模态史诗级碾压GPT-4!语言理解首超人类 (qq.com)
锐评:
侧重点应该是多模态吧,至于效果和智能程度应该没有质的改变,毕竟对比得分也高不到哪去。
觉得这是一个必然的方向吧,智能程度不一定还能迅速提高多少,但是可以从广度上面做得更好,同时当这个广度覆盖生活大部分场景时,就可以通过很多应用支撑到普通人的许多工作,这个时候就是产品级别的爆发式创新了
比如一种多模态运用的终端是,看到有一种pin的设备,扫描图像、捕获音频,然后实时给你提供建议,乃至借助眼镜这种载体直接显示图像和文字。这种如果能做到大范围普及,也足够科幻了
不过现在做得怎么样了,还是让子弹飞一会吧。show me your code,看到实际产品表现再说
试了一下bard,但是现在还没看到最新的集成(而且数据对比估计都用的是最牛的ultra,pro大概率还比不上gpt4呢,不过可以期待一下多模态的表现)

Tools

Fitten code

类似Copilot的代码工具,速度还挺快,试用了一下还行。

免费GPT-4&GPTs

 

开通ChatGPT Plus in 2024年01月16日
开通ChatGPT Plus in 2024年01月16日
windows更新的坑以及禁止
windows更新的坑以及禁止