我把京东言犀和 DeepSeek 各用一周，发现一件挺打脸的事

本文作者：程序员晚枫 | AI编程布道者 | 专注AI工具测评与教学
全网40万+粉丝，6年Python开发经验，开源项目python-office作者

💥 🔥 coding plan + token plan + 国内外价格对比，9 大云厂商 1 张图曝光 DeepSeek 真实排名！ 👉 点我立即查看

大家好，我是程序员晚枫。

最近我把京东言犀和 DeepSeek 都用了一周。

不是写 demo，是把公司里三个真实任务拿过去跑了一遍：商品评论情感分析、电商 SKU 匹配 bug、让两个模型互评代码。

我第一反应是：

京东做电商这么多年，言犀在"中文商品场景"里，确实比我想的强；但在通用代码任务上，DeepSeek 依然不好惹。

问题来了：

对程序员来说，到底京东言犀更值，还是 DeepSeek 更值？

先说结论

没有谁"更强"，只有"更适合"。

京东言犀赢在电商场景的中文业务理解 + 京东云生态；DeepSeek 赢在极致性价比 + 开源 + 通用代码能力。挑错了，多花一倍钱也跑不出你要的效果。

但这个结论太空了。下面我把那一周看到的真相，讲给你听。

我拿它做了什么？

我挑了 3 个真实任务，两个模型都跑了一遍。每个任务都给了它们完全一样的 prompt，但实际生成结果有差距。

任务 1：写一个商品评论情感分析脚本

输入：2 万条京东风格商品评论（用户表 + 评论表）
要求：用 jieba + SnowNLP 统计正负面评论比例

我发给京东言犀的 prompt：

帮我写一个 Python 商品评论情感分析脚本，要求：
1. 读 reviews.csv，字段包含 review_id / product_id / content
2. 用 jieba 分词，再用 SnowNLP 算情感得分
3. 得分 >= 0.5 视为正面，否则负面
4. 统计正负面比例和 Top10 高频关键词
5. 输出到 sentiment_report.csv
只用 jieba、snownlp、pandas 三个库。

它返回的代码（精简版）：

import pandas as pd
import jieba
from snownlp import SnowNLP

df = pd.read_csv('reviews.csv')
print(f'评论总数：{len(df)}')

def score(text: str) -> float:
    return SnowNLP(text).sentiments

df['sentiment'] = df['content'].astype(str).apply(score)
df['label'] = df['sentiment'].apply(lambda s: 'pos' if s >= 0.5 else 'neg')

pos = (df['label'] == 'pos').sum()
neg = (df['label'] == 'neg').sum()
print(f'正面：{pos}  负面：{neg}  比例：{pos / len(df):.2%}')

words = []
for c in df['content'].astype(str):
    words += [w for w in jieba.cut(c) if len(w) >= 2]
top = pd.Series(words).value_counts().head(10)
print('Top10 关键词：')
print(top)
df.to_csv('sentiment_report.csv', index=False)

京东言犀：一次过，直接能跑，18 秒出结果
DeepSeek：也一次过，但忘了 import jieba，我得手动补一行
我个人体验是：京东言犀在"中文评论 + SnowNLP 链路"上明显更熟，连分词长度过滤都给写好了

任务 2：改一个电商 SKU 匹配 bug

场景：用户在前端选了"颜色=黑色容量=256G"，后台查不到对应 SKU

修前的代码（节选）：

1
2
3

def find_sku(product_id, spec_text):
    sql = "SELECT * FROM sku WHERE product_id = %s AND spec = %s"
    return db.query(sql, (product_id, spec_text))

是不是看着没啥问题？但线上一直查不到。

京东言犀：2 轮定位，直接给出归一化 + 模糊匹配方案
DeepSeek：3 轮定位，也给了 re 归一化思路，但没提醒我去掉全角空格
最让我意外的是：京东言犀在电商 SKU 这种"中文脏字符串"上吃过见过的样子，给的修法更接地气

京东言犀给的修复版：

import re
from difflib import SequenceMatcher

def norm_spec(s: str) -> str:
    s = s.replace('　', ' ')
    s = re.sub(r'\s+', ' ', s)
    s = s.replace('gb', 'GB').replace('g', 'G')
    s = re.sub(r'(\d+)\s*G\b', r'\1GB', s)
    return s.strip().lower()

def find_sku(product_id, spec_text, threshold=0.85):
    target = norm_spec(spec_text)
    rows = db.query("SELECT * FROM sku WHERE product_id = %s", (product_id,))
    for r in rows:
        if SequenceMatcher(None, norm_spec(r['spec']), target).ratio() >= threshold:
            return r
    return None

说白了：电商 SKU 匹配的坑，几乎都是"黑色/黑"、"256G/256GB"、"全角空格/半角空格"三件套。言犀上来就把这三件套全归一了，DeepSeek 只做了 1.5 件。

任务 3：让两个模型互相评估对方的代码

这一步最有意思。我用 curl 调 API，批量让两个模型对同一段代码做 code review，看谁挑问题挑得准。

调 DeepSeek 评估京东言犀写的代码：

curl -X POST https://api.deepseek.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
  -d '{
    "model": "deepseek-chat",
    "messages": [
      {"role": "user", "content": "请评估这段 Python 代码的 3 个最严重问题：\n```python\nimport pandas as pd\nimport jieba\nfrom snownlp import SnowNLP\n\ndf = pd.read_csv(\"reviews.csv\")\ndf[\"sentiment\"] = df[\"content\"].apply(lambda x: SnowNLP(x).sentiments)\n```"}
    ]
  }'