我用讯飞星火和 DeepSeek 各一周，发现一件很打脸的事

本文作者：程序员晚枫 | AI编程布道者 | 专注AI工具测评与教学
全网40万+粉丝，6年Python开发经验，开源项目python-office作者

💥 🔥 coding plan + token plan + 国内外价格对比，9 大云厂商 1 张图曝光 DeepSeek 真实排名！ 👉 点我立即查看

大家好，我是程序员晚枫。

最近我把讯飞星火和 DeepSeek 各用了一周，发现一件挺意外的事。

不是写 demo，是把公司里两个真实项目拿过去跑了一遍：一个语音转文字的后处理脚本，一个前端 WebSocket 断连的 bug 修复。

我第一反应是：

让一个做语音的模型去写代码，就像让一个语文老师去解高数题。

问题来了：

对程序员来说，讯飞星火到底能不能当主力用，还是只能当"语音专家"？

先说结论

没有谁"更强"，只有"更适合"。

讯飞星火赢在语音 + 中文场景 + 政企生态；DeepSeek 赢在性价比 + 推理 + 开源。选错了，省下的 token 钱不够你补 bug 浪费的时间。

但这个结论太空了。下面我把那一周看到的真相，讲给你听。

我拿它做了什么？

我挑了 3 个真实任务，两个模型都跑了一遍。每个任务都给了它们完全一样的 prompt，看谁更适合这个场景。

任务 1：写一个语音转文字的后处理脚本

场景：讯飞 ASR 原始输出里塞满"嗯""啊""那个""就是说"这种语气词，还有"我想我想""这个这个"这种重复词
要求：清洗语气词 + 合并重复词 + 按语义分句

我发给讯飞星火的 prompt：

帮我写一个 Python 脚本，输入是讯飞 ASR 输出的字符串，要求：
1. 去除"嗯""啊""呃""那个""就是说""然后"等口语语气词
2. 合并连续重复的词（比如"我想我想"合并为"我想"）
3. 用 jieba 分句，保留标点，输出列表
4. 不要引入 transformers / torch，只用 re + jieba

它返回的代码（精简版）：

import re
import jieba

FILLERS = {'嗯', '啊', '呃', '那个', '就是说', '然后', '就是'}

def clean_asr(text: str) -> str:
    pattern = '|'.join(re.escape(w) for w in sorted(FILLERS, key=len, reverse=True))
    text = re.sub(rf'\b({pattern})\b', '', text)
    text = re.sub(r'(.{1,4}?)\1{1,}', r'\1', text)
    return re.sub(r'\s+', ' ', text).strip()

def split_sentences(text: str) -> list:
    text = re.sub(r'([。！？!?])', r'\1<SEP>', text)
    return [s.strip() for s in text.split('<SEP>') if s.strip()]

if __name__ == '__main__':
    raw = "嗯，我想我想，就是说，这个这个方案，嗯啊，还是按原计划推进。"
    cleaned = clean_asr(raw)
    print(split_sentences(cleaned))

讯飞星火（Spark V4.0）：一次过，直接能跑，语气词正则覆盖了 7 个高频词
DeepSeek：也一次过，但去重那块写成了 (w)\1 整词匹配，遇到"我想我想"会变成"我想想"，我又让它改了 2 轮
我个人体验是：讯飞星火对"中文口语场景"的理解明显更准，DeepSeek 在通用代码上更稳，但在中文特殊字符场景要返工

任务 2：改一个 WebSocket 断连 bug

场景：前端连接讯飞流式 ASR 时，每 30 秒必断一次，控制台疯狂报 WebSocket is already in CLOSING or CLOSED state

修前的代码（节选）：

const ws = new WebSocket('wss://iat-api.xfyun.cn/v2/iat')
ws.onopen = () => {
  console.log('connected')
  ws.send(JSON.stringify({ /* 鉴权参数 */ }))
}
ws.onmessage = (e) => {
  console.log('recv:', e.data)
}
ws.onclose = () => {
  console.log('disconnected')
}

讯飞星火给的修复版：

const url = 'wss://iat-api.xfyun.cn/v2/iat'
let ws = null
let heartbeat = null
let retry = 0

function connect() {
  ws = new WebSocket(url)
  ws.onopen = () => {
    console.log('connected')
    retry = 0
    heartbeat = setInterval(() => {
      if (ws.readyState === WebSocket.OPEN) {
        ws.send(JSON.stringify({ action: 'heartbeat' }))
      }
    }, 15000)
  }
  ws.onmessage = (e) => console.log('recv:', e.data)
  ws.onclose = () => {
    clearInterval(heartbeat)
    const delay = Math.min(30000, 1000 * Math.pow(2, retry))
    retry += 1
    setTimeout(connect, delay)
  }
  ws.onerror = () => ws.close()
}
connect()

讯飞星火：2 轮对话定位 + 给出带 15 秒心跳 + 指数退避重连的完整修复
DeepSeek：1 轮对话就给到了，但心跳间隔写成了 60 秒，讯飞 idle timeout 是 30 秒，照搬还是会断
最让我意外的是：讯飞星火在自家 SDK 协议细节上懂的，反而比 DeepSeek 多

任务 3：让两个模型互相评估对方的代码

这一步最有意思。我用 curl 调星火 API，让 DeepSeek 来 review 星火写的代码，看谁挑问题挑得准。

调讯飞星火 API，把代码塞给 DeepSeek 评估：

curl -X POST https://api.deepseek.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
  -d '{
    "model": "deepseek-chat",
    "messages": [
      {"role": "user", "content": "请评估这段 JavaScript 代码的 3 个最严重问题：\n```javascript\nconst ws = new WebSocket(url)\nws.onclose = () => setTimeout(connect, 1000)\n```"}
    ]
  }'