来源:量子位

华为DeepSeek联手,全套国产——

国产大模型云服务平台SiliconCloud(硅基流动),首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。 

Web端/手机端均可用,价格非常便宜,春节期间还打折,目前使用成本如下:

  • DeepSeek-V3:输入只需1块钱/M tokens,输出2块钱/M tokens

  • DeepSeek-R1:输入4块钱/M tokens,输出16块钱/M tokens

这个价格与DeepSeek官方优惠期(截至2月8日24:00)价格保持一致。

dfbf4ac2673081235107c7c3397d1170.png

与此同时,DeepSeek的多模态模型Janus-Pro-7B还限免。

1ddf5e098693b6e059fa49d7074e87fe.png

消息一出,全球用户疯狂涌入,疯狂到用“爆”都难以贴切形容。

SiliconCloud创始人兼CEO袁进辉在朋友圈表示,这波全套国产带来的泼天流量,远比团队想象中的大得多——尽管他们的预期是建立在DeepSeek春节期间爆得有目共睹的基础上。

因此,官宣上线服务的第10个小时开始,SiliconCloud做出决定:

只能限流。

eca7ce719715d2b79c741dbd3826421c.jpeg

华为DeepSeek联手

经过华为云、SiliconCloud以及DeepSeek三个团队多日来的加班攻坚,国内用户迎来了这样一个春节大礼包!

此次联手主要具备以下几个特点:

1、全国产。得益于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU部署模型的效果。

2、稳定的、生产级的推理服务。让模型能够在⼤规模生产环境中稳定运行,并满足业务商⽤部署需求。

3、零部署门槛,价格与官方优惠期保持一致。开发者开发应用时可直接调用 SiliconCloud API,使用起来很简单轻松。

  • 截至2月8日24:00,DeepSeek-V3价格为1元 / M tokens(输入)、2元 / M tokens (输出)

  • DeepSeek-R1 的价格为 4元 / M tokens(输入)、16元 / M tokens (输出)

  • 两个模型上下文长度均为64K,最大输出长度为4K

  • DeepSeek-R1最大思维链长度为4K

51dda43fa2e1cff00ad7548eb4ffdbdc.png

除了开发者之外,用户也可以在线体验,免费的那种。

e39d663f6f82e0f2b838eb51158ff1a5.png
087ecac0c0c4d97c10b31534f040b7b9.png

话不多说,咱们就进行一波实测。

在使用前接受一些基本参数设置,包括提示词、最大Token、Temperature等等。

dd2c2d3dd540f9da4a851dbeeb2db3dd.png

也可同时选中两个模型进行一番对比。

大年初五迎财神可以干什么?

在响应速度上,两个都差不多,每秒15、16tokens输出。

e0ad57cf1c243777bec48ab56ef505ef.png

从回答内容上看,V3比较直给,它直接罗列出来,有放鞭炮、打扫卫生、祭拜财神等。

R1考虑了用户背景、传统习俗、与现代社会的适应性、背后意义以及注意事项等。嗯,确实很全面。

用同样的问题问DeepSeek官方(深度思考模式),可以看到,在没有最大tokens的限制下,它输出的内容更多。

响应速度上面其实差不多的,给出的答案比较直接。

思考过程对比:

b46b05998dc45af0bbc448ea580b3d08.png
8fcf96e1ecde6c17c85dbc4a1623ff74.png

回答内容:

9501c59e2bdc8d1e4f1a084f24b89ba2.png

d6d235fef3efbc6be2d1792b5dfbd613.gif

大家可以根据需求和使用体验自行选择。

但总而言之,国内开发者们可以放心用来开发各种各样地应用啦~

“部分成果会集成在华为软件包里给用户”

SiliconCloud官方推文表示:

无论是在昇腾上适配DeepSeek-R1&V3双模型,还是在此前上线其他模型的过程中,公司都得到了DeepSeek与华为云的大力支持。

袁进辉则在即刻和朋友圈透露了这次联手的更多消息。

譬如,这次合作,源于SiliconCloud员工的“突发奇想”:用国产卡,跑DeepSeek

于是一拍即合,很快得到了华为方调配的充足资源,DeepSeek团队也“全程无私提供了很多经验”。

SiliconCloud、华为多条业务线、DeepSeek的同学们,就这么过了一个特别(忙)的春节。

他还在朋友圈回应,此次成果的一部分会集成在华为软件包里给用户

52f9d08f5853863f1c7d04914c257440.png

与此同时,袁进辉也明确表示,现在只是一个初级成果,正持续提升使用体验中

譬如一度出现的“R1触发深度思考概率有点低,发现是prompt和chat template问题,预计傍晚时能升级好”。

然后就真的在昨晚18点左右完成修复。

另一边,用起来的网友们已经有诸多反馈了。

即刻网友@葬爱咸鱼 表示,自己的使用体验和DeepSeek官方的没差。

84b413b228147fb54cfc24be39bb21ff.png

另一名即刻网友@张翼轸 也在袁进辉的即刻动态下分享了自己的使用体验。

划重点:平台上R1速度体感超过了DeepSeek在Web端的速度,但同时有一些使用体验希望修正。

0364c69bd4dc1350cdb345047dac27b7.png

当然,由于主要是为开发者提供API服务,SilionCloud的playground只提供最基础的体验功能

想要搭配使用V3、R1,还是需要调用API接口才能实现。

dd1b6e9f4c647263fbdede46fc07292a.png

One More Thing

综观全球数据,DeepSeek现有2点特别值得关注:

第一,上线19天,DeepSeek日活达到1909万

这个数据超过ChatGPT,意味着DeepSeek成为全球增速最快AI应用。

第二,DeepSeek-R1在City-Data的创意写作榜上拿下第一,终结了Claude霸榜7个月的局面

而这个榜单上,同为推理模型的o1-mini排名22,o3-mini表现未入榜单。

dc47d04d86feeaaee62b823c78c9ade6.png

试玩playground:
https://siliconflow.cn/zh-cn/models

参考链接:
[1]https://mp.weixin.qq.com/s/9AC5W4SjdWyFypnl3TBdUg
[2]https://mp.weixin.qq.com/s/sl_N-kjouq8NRK3kcdsaaQ
[3]https://x.com/ashfold/status/1885613592881619278
[4]https://x.com/teortaxesTex/status/188559366720680357

推荐阅读

欢迎大家加入DLer-计算机视觉技术交流群!

大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

bf410ca8b2e9fb586a44873a89806a47.jpeg

👆 长按识别,邀请您进群!

6fd87dd3b8468e5e7ed80089f6f33ff1.gif

Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐