我用文心一言和 DeepSeek 各一周，发现一件挺反常识的事

本文作者：程序员晚枫 | AI编程布道者 | 专注AI工具测评与教学
全网40万+粉丝，6年Python开发经验，开源项目python-office作者

💥 🔥 coding plan + token plan + 国内外价格对比，9 大云厂商 1 张图曝光 DeepSeek 真实排名！ 👉 点我立即查看

大家好，我是程序员晚枫。

最近我把文心一言（ERNIE，跑在百度智能云千帆上）和 DeepSeek 都用了一周。

不是写 demo，是把公司里两个真实项目拿过去跑了一遍：一个 Excel 多 sheet 月度汇总脚本，一个 pandas groupby 索引错位的 bug。

我第一反应是：

这两个模型真的不是同一个赛道的对手，但所有人都在让它们硬比。

问题来了：

对程序员来说，到底是文心一言更顺手，还是 DeepSeek 更值？

先说结论

没有谁"更强"，只有"更适合"。

文心一言赢在中文业务顺 + 百度智能云生态 + 千帆 OpenAI 兼容；DeepSeek 赢在极致性价比 + 开源推理。挑错了，多花一倍钱也跑不出你要的效果。

但这个结论太空了。下面我把那一周看到的真相，讲给你听。

我拿它做了什么？

我挑了 3 个真实任务，两个模型都跑了一遍。每个任务都给了它们完全一样的 prompt，但实际生成结果有差距。

任务 1：写一个 Excel 多 sheet 数据汇总脚本

输入：一个 Excel 文件，3 个 sheet（华北 / 华东 / 华南 6 月销售明细）
要求：合并三个 sheet，按"销售员"汇总金额，写回一个新 sheet "月度汇总"

我发给文心一言的 prompt：

帮我写一个 Python 脚本，用 pandas/openpyxl 读取 sales.xlsx：
1. 文件里有 sheet '华北'、'华东'、'华南'，分别对应三个区域 6 月销售明细
2. 列名：日期、订单号、金额、销售员
3. 把三个 sheet 数据合并，按"销售员"汇总金额
4. 输出到当前 Excel 的一个新 sheet "月度汇总"
5. 按金额降序排列，最后打印总行数和总金额
不要装 pandas/openpyxl 之外的依赖，代码能直接跑。

它返回的代码（精简版）：

import pandas as pd

file = 'sales.xlsx'
sheets = ['华北', '华东', '华南']

dfs = [pd.read_excel(file, sheet_name=s) for s in sheets]
df_all = pd.concat(dfs, ignore_index=True)

print(f'原始行数：{len(df_all)}')
print(f'总金额：{df_all["金额"].sum():.2f}')

summary = (
    df_all.groupby('销售员', as_index=False)['金额']
    .sum()
    .sort_values('金额', ascending=False)
)

with pd.ExcelWriter(file, engine='openpyxl', mode='a', if_sheet_exists='replace') as writer:
    summary.to_excel(writer, sheet_name='月度汇总', index=False)

print('已写入 月度汇总 sheet')
print(summary)

文心一言（ERNIE-4.0）：一次过，直接能跑，连中文 sheet 名拼写不一致的情况都提示了
DeepSeek：一次过，逻辑对，但没提醒我 Excel 里 sheet 名可能带 'sheet ' 前缀，我得自己核
我个人体验是：文心一言这种"细节都帮你提前考虑"的写法，省了我一次返工

任务 2：修一个 pandas groupby 索引错位的 bug

场景：两个 DataFrame merge 出来全是 NaN，定位到 groupby 后没 reset_index

修前的代码（节选）：

import pandas as pd

orders = pd.DataFrame({
    'order_id': [1, 2, 3, 4],
    'user_id':  ['u1', 'u2', 'u1', 'u3'],
    'amount':   [100, 200, 50, 300],
})

# 错误写法：groupby 之后没 reset_index
user_total = orders.groupby('user_id')['amount'].sum()
print(user_total)
# user_id
# u1    150
# u2    200
# u3    300
# Name: amount, dtype: int64

users = pd.DataFrame({
    'user_id':   ['u1', 'u2', 'u3'],
    'user_name': ['张三', '李四', '王五'],
})

result = users.merge(user_total, on='user_id', how='left')
print(result)
#   user_id user_name  amount
# 0     u1       张三     NaN    ← 全部空
# 1     u2       李四     NaN
# 2     u3       王五     NaN

文心一言给的修复版：

import pandas as pd

orders = pd.DataFrame({
    'order_id': [1, 2, 3, 4],
    'user_id':  ['u1', 'u2', 'u1', 'u3'],
    'amount':   [100, 200, 50, 300],
})

# 关键改动：groupby 时直接 as_index=False，少写一行 reset_index
user_total = (
    orders
    .groupby('user_id', as_index=False)['金额']
    .sum()
)

users = pd.DataFrame({
    'user_id':   ['u1', 'u2', 'u3'],
    'user_name': ['张三', '李四', '王五'],
})

result = users.merge(user_total, on='user_id', how='left')
print(result)
#   user_id user_name  amount
# 0     u1       张三     150
# 1     u2       李四     200
# 2     u3       王五     300

文心一言：一次定位，直接给 as_index=False 的根治方案
DeepSeek：也是一次定位，但给的是 user_total = user_total.reset_index()，效果一样但要多写一行
我个人体验是：两者都能修，但文心一言这种"少写一行"的写法，更像有经验的 pandas 玩家

任务 3：用 curl 调百度千帆 API，让 DeepSeek 评估文心写的代码

这一步最有意思。我让文心一言先写一段代码，然后通过千帆的 OpenAI 兼容协议，把这段代码发给 DeepSeek 做 code review。

先用文心一言生成一段代码（prompt：写一个 Python 函数，把一个 list 按出现频率排序），然后通过千帆 API 把这段代码喂给 DeepSeek：

curl -X POST https://qianfan.baidubce.com/v2/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $QIANFAN_TOKEN" \
  -d '{
    "model": "deepseek-chat",
    "messages": [
      {"role": "user", "content": "请评估这段 Python 代码的 3 个最严重问题：\n```python\nfrom collections import Counter\ndef freq_sort(lst):\n    return sorted(lst, key=lambda x: Counter(lst)[x], reverse=True)\n```"}
    ]
  }'