没花太多时间,只是泛泛的尝试了一些以前问过 ChatGPT或者 Claude 的。一些感觉:
- Grok 有多重人格,很分裂,似乎后面有若干个不同的模型,或者若干个不同“对齐”后的模型,在根据不同类型的问题,自动挑选一个人格来对话。
- 经常出现“searching for xyz”,但不太确定它是在搜索外网,还是自己的一个 embedding 的知识库,因为在出现这个提示的很多情况下,我问的问题并没有时效性,没有上网去搜的必要。
- 在一些试验中,它显示了搜索,在回答底下也出现了一些 X 平台的链接,但是答案却没有用上链接里面的内容,虽然答案是正确的。所以有可能搜索在一些情况下只是为了提供一些 X 平台的链接。
- 人文方面,回答质量跨度很大,有时候非常政治正确,甚至自己结尾还说,分析这个问题时要注意政治正确。但有的时候的回答,确实比其他 AI 更“直白”,不绕圈子,不打哈哈。
- 不知道 Fun mode 在后台具体有些什么不同的机制,对比下来,Regular mode 更“笨”,回答比较机械和流于表面。
- 理工代码方面,基本普通使用,和Gemini Pro在一个水平,跟 GPT4有一丝差距。
- 多轮对话方面,容易串题跟丢,可能是文本窗口还是比较小
以上很多感觉都是基于一两个例子,并非科学统计。Grok 并没有丝毫惊艳到我的,似乎现阶段是一个更情绪化的 Claude。如果我只能使用一个聊天机器人,首选还是 ChatGPT。




