Skip to content

🧠 模型

GPT / Claude / Gemini / 开源模型 / 架构 — 共 89 条活跃资源

📅 今天

你不知道的大模型训练:原理、路径与新实践

@Tw93 · ⭐⭐⭐⭐⭐5 🇨🇳 · 今天

Tw93 继 Claude Code 和 Agent 深度分析后的第三篇长文,系统梳理大模型训练全链路。核心判断:2026 年拉开差距的不再是预训练本身,而是后训练、评测、奖励、Agent 训练、蒸馏。详细拆解了预训练(数据配方、过训练、tokenizer 设计)、后训练多阶段流水线(冷启动 SFT → GRPO 强化学习 → 拒绝采样微调 → 对齐 RL)、评测-Grader-Reward 反馈回路、推理模型(o1/DeepSeek-R1)、Agent 训练(Kimi K2.5 PARL、Cursor Composer 2、Chroma Context-1)、Meta-Harness(只改 harness code 就能拉出 6x 性能差距)。含大量配图和 14 篇参考文献。

大模型训练 预训练 后训练 RLHF 蒸馏


该项目在github上:https://github.com/OminousIndustries/PhoneDriver

@DLKFZWilliam2 · ⭐⭐⭐⭐4 · 今天

@DLKFZWilliam2 (独立开发者William) 🕐 Sun Mar 01 01:05:49 +0000 2026 📊 ❤️ 56 🔁 11 🔖 101 👁️ 3,663 💬 1 该项目在github上:https://github.com/OminousIndustries/PhoneDriver 链接:https://github.com/OminousIndustries/PhoneDriver A Python-based mobile automation agent that uses Qwen3-VL vision-language models to understand and interact with Android devices through visual analysis and ADB commands.

agent qwen phone-ai automation github


OpenAI CEO 详解 GPT-4与AI的未来(播客笔记)

⭐⭐⭐⭐4 🇨🇳 · 今天

#67 OpenAI CEO 详解 GPT-4与AI的未来(播客笔记) 3月20日,OpenAI CEO Sam Altman 和科技主播 Lex Fridman 进行对谈,主要讨论 GPT-4、通用人工智能(AGI)、 OpenAI 公司、AI 带来的潜在问题,以及 AI 的未来。我总结了对话中最启发我的部分,约 3000字。受限于精力与认知,笔记中难免有谬误,敬请指正。总体来说,Sam Altman 认为,GPT-4 等 AI 系统并非少数人的成果,而是源于无数人... Read in Cubox
Read Original 3月20日,OpenAI CEO Sam Altman 和科技主播 Lex Fridman 进行对谈,主要讨论 GPT-4、通用人工智能(AGI)、 OpenAI 公司、AI 带来的潜在问题,以及 AI 的未来。 我总结...

ChatGPT GPT-4 OpenAI AI Safety


2023 年,我患上了 AI 焦虑症

⭐⭐⭐⭐4 🇨🇳 · 今天

2023 年对我来说是神奇的一年,我意外的从一个程序员变成了一个 AI 资讯届的“网红”,到年底的时候我在 X 平台的阅读量超过 1 亿,微博上的阅读量则超过 10 亿,很多人通过我的微博或者 X 了解最新的 AI 资讯、教程和 Prompt 使用技巧。而这一切其实是从我患上了 AI 焦虑症开始的。我将向你分享我的故事,如何患上了 AI 焦虑症,又是如何克服它,并且成功的把 AI 变成自己的得力助手,让自己成为善用 AI 的人。 Read in Cubox
Read Original 2023 年对我来说是神奇的一年,我意外的从一个程序员变成了一个 AI 资讯届的"网红",到年底的时候我在 X 平台的阅读量超过 1 亿,微博上的阅读量则超过 10 亿,很多人通过我的微博或者 X 了解最新的 AI 资讯、教程和 Prompt 使用技巧。而这一切其实...

ChatGPT GPT-4 OpenAI Stable Diffusion Midjourney


2025 LLM Year in Review

⭐⭐⭐⭐4 🌐 · 今天

2025 LLM Year in Review Read in Cubox
Read Original ?imageUrl=https%3A%2F%2Fbear-images.sfo2.cdn.digitaloceanspaces.com%2Fkarpathy%2Funnamed.webp) 2025 has been a strong and eventful year of progress in LLMs. The following is a list of personally notable and mildly surprising "paradigm changes" - things that altered the landscape and stood out to me conceptually.

  1. Reinforce...

LLM DeepSeek


AI 助力网站出海:只靠聊天,做高颜值网站,你也行!

⭐⭐⭐⭐4 🇨🇳 · 今天

AI 助力网站出海:只靠聊天,做高颜值网站,你也行! 4次与AI的对话,来让大家看看如何做出精美的AI播客网站。 Read in Cubox
Read Original 朋友好,我是赫兹! 一个探索网站出海生意的新手,上次分享了第一次赚美元!纯新手深度复盘网站出海,一文掌握全流程 之后,有朋友问我可以详细说说设计开发部分吗,今天我就来聊聊设计开发部分。 ?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FgG3yexRibCUcHf2EUMa2lS5z7pKTHia9RsywRYOWtzCia9sP49rjjg6TObaX4tvOc5sia949Qn5myn5UwwFu9Xhw5g%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg&valid=false) 今天我用4次与...

ChatGPT Agent DeepSeek Global


AI时代的性能分析:GPU Profiling初探

⭐⭐⭐⭐4 🌐 · 今天

AI时代的性能分析:GPU Profiling初探 关于GPU Profiling和可视化的鸟瞰。 Read in Cubox
Read Original 在CPU优化的过程中,例如我们遇到CPU打满的情况,我们可以通过perf等工具进行Profiling,然后将数据可视化成火焰图等形式进行分析;同样的,在GPU的优化过程中,我们也可以通过Profiling来进行性能优化。 例如在大热的DeepSeek的推理系统中,就提到用Profiling来优化: ?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2F0A9N2rUnQ9NqibzY6Z9a7UtqdyksyJUkJcmfKOta4JeXM2oxgVrZHYWIXE8vo8HEvKicicroz3x7M50jLRm1xlHXw%2F640...

Inference DeepSeek Performance Profiling


Android×鸿蒙×AI 技术刊#第10期——端侧AI · Kuikly性能 · Flow避坑 · 脱壳 · Dex解析...

⭐⭐⭐⭐4 🇨🇳 · 今天

Android×鸿蒙×AI 技术刊#第10期——端侧AI · Kuikly性能 · Flow避坑 · 脱壳 · Dex解析... Read in Cubox
Read Original 亲爱的开发者朋友们,本周的Android技术周刊来啦!无论你在打磨性能、深潜底层,还是探索AI边界,这些新鲜热乎的干货都能助你一臂之力: Google全新 MLKit端上生成式API 现已开放!只需几行代码,就能让Gemini Nano在用户手机里完成文档总结、图片描述(离线免费+极速510 tokens/秒)。 腾讯开源 Kuikly框架鸿蒙适配方案!通过命令式CAPI暴改渲染链路,实测比React Native快6倍,QQ浏览器、腾讯新闻已投产,你的跨平台项目也能抄作业!

Gemini Android Fine-tuning Performance Weekly


Android×鸿蒙×AI 技术刊#第13期——APK极速瘦身策略、MVI架构实践与AI工具链新动态

⭐⭐⭐⭐4 🇨🇳 · 今天

Android×鸿蒙×AI 技术刊#第13期——APK极速瘦身策略、MVI架构实践与AI工具链新动态 Read in Cubox
Read Original 本周 Android 生态聚焦性能优化、架构演进与 AI 融合三大方向: 1️⃣ 性能深度优化APK 瘦身实战:Unreal 项目压缩 NativeLibs 与资源,实现 1.23G → 130M 体积优化; 鸿蒙组件冻结技术:freezeWhenInactive 属性抑制非活跃 UI 刷新,降低主线程负载。 2️⃣ 开发范式革新MVI 架构解析:厘清单向数据流与状态管理核心,对比 Redux/MVVM 适用场景;Flutter Hotload 突破:双重映射技术绕过 iOS 26 权限限制,恢复真机 Hotload 能力。

Gemini Android Performance


Azure OpenAI 的提示工程技术 - Azure OpenAI Service | Microsoft Learn

⭐⭐⭐⭐4 🇨🇳 · 今天

Azure OpenAI 的提示工程技术 - Azure OpenAI Service | Microsoft Learn 了解有关如何使用 GPT-3、ChatGPT 和 GPT-4 模型进行提示工程的选项 Read in Cubox
Read Original 本指南不深入介绍聊天补全消息结构背后的机制。 如果你不熟悉以编程方式与 ChatGPT 和 GPT-4 模型交互,建议先阅读有关聊天补全 API 的操作指南。 本指南的这一部分中的所有示例都针对基础 GPT-4 模型进行了英语测试。 如果你在通过另一种语言阅读本文的本地化版本,则这些响应表示英语结果的本地化翻译。 若要根据你用于提示模型的语言详细了解潜在的限制,请参阅负责任 AI 透明度说明。

ChatGPT GPT-4 GPT-3 OpenAI Prompt Engineering


OpenAI o1模型的前世今生

⭐⭐⭐⭐4 🇨🇳 · 今天

深度解析 OpenAI o1 模型技术路线。从 System 1/System 2 思维框架切入,指出此前 LLM 都用快思考模式,o1 引入慢思考多步推理。核心创新在预训练、后训练(强化学习)和推理阶段突破,代表从 pattern completion 到 structured reasoning 的范式转变。

openai o1 reasoning system-2 chain-of-thought


Writing a storage engine for Postgres: an in-memor...

⭐⭐⭐⭐4 🌐 · 今天

[需翻译] Writing a storage engine for Postgres: an in-memor...


Writing my own ChatGPT Code Interpreter

⭐⭐⭐⭐4 🌐 · 今天

[需翻译] It's called GPT-Code UI and is now available on GitHub and PyPI


o1发布后,信息量最大的圆桌对话:杨植麟、姜大昕、朱军探讨大模型技术路径

⭐⭐⭐⭐4 🇨🇳 · 今天

?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FqpAK9iaV2O3sAVsSPfCN9UX44XiaoicbUJIrOGuaujdMNY6iaQewDZEX1GY3tcVk3QGeKJyUMMHBSMALvO8B7DZwsA%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg)


《GPT-4 ,通用人工智能的火花》论文内容精选与翻译

⭐⭐⭐⭐4 🇨🇳 · 今天

《通用人工智能的火花:GPT-4早期实验》是3月最重要的一篇论文,引起了广泛的关注和讨论,但是论文长达 154页,中文版本还无人翻译。


【GDE 分享】移植 Mediapipe LLM Demo 到 Kotlin Multiplatform

⭐⭐⭐⭐4 🌐 · 今天

[需翻译] 【GDE 分享】移植 Mediapipe LLM Demo 到 Kotlin Multiplatform


【社区说-回顾】全方位 360° 讲解 Gemini 2.0,我家的猫真会后空翻

⭐⭐⭐⭐4 🇨🇳 · 今天

为了帮助大家更好地了解和掌握 Gemini2.0 的使用技巧,GDG 社区在 2.27 晚上7点在线上举办了「社区说」分享活动,邀请多位资深的 AI 开发专家,从不同角度为大家解读 Gemini 2.0 的最新变化和开发技巧。本文将带领大家详细回顾此次活动特约嘉宾们的精彩分享。


一个半月高强度 Claude Code 使用后感受

⭐⭐⭐⭐4 🇨🇳 · 今天

上善若水,人淡如菊。这里是王巍 (onevcat) 的博客,用来记录一些技术和想法,主要专注于 Swift 和 iOS 开发。


一文看懂2025 Google IO,誓把一切“装”上Gemini,谷歌眼镜10年逆袭归来

⭐⭐⭐⭐4 🇨🇳 · 今天

?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FrwnawOsSCFp2Z2DmFAnFZUc8vdSfTiasibQ5zRUAxX17lTWmG4PicYGgLqD4iaywFMpOs5W4AVFQVrqjBW0QvpG14A%2F640%3Fwx_fmt%3Dgif)


万字盘点 2023 年 Android 领域的重要技术:AI,14,Compose,鸿蒙...

⭐⭐⭐⭐4 🇨🇳 · 今天

AICore2022 年底横空出世的 GPT-3.5 引发了全球的大模型 LLM 狂潮。作为在 AI 领域耕


从 ChatGPT 看 AI 未来的 7 种场景可能性

⭐⭐⭐⭐4 🇨🇳 · 今天

Cubox 收藏 — 从 ChatGPT 看 AI 未来的 7 种场景可能性


你不知道的 Agent:原理、架构与工程实践 - Tw93

⭐⭐⭐⭐4 🇨🇳 · 今天

研究完 Claude Code 的架构之后,发现自己对 Agent 底层的理解还不够深入,加上团队在 Agent 方向已经有不少业务落地,但一直缺少一份系统梳理,所以又补了一轮资料、开源实现和轻量实验,把控制流、上下文工程、工具设计、记忆、评测和安全这些问题重新串了一遍。


关于 GPT-5,你需要知道的一些事

⭐⭐⭐⭐4 🇨🇳 · 今天

当大模型基座开始下场卷 Agent,卷应用(你还别说,vibe coding 渐变色真挺“炫”)...


图解DeepSeek-R1的创新训练和推理模型实现原理

⭐⭐⭐⭐4 🇨🇳 · 今天

DeepSeek-R1的成功标志着AI在推理能力方面的重要突破。它不仅展示了如何构建高性能的推理模型,更重要的是提供了一套可复现的技术方案,为整个AI社区带来了宝贵的经验。


奥特曼斯坦福对话万字实录来了!关于GPT5、AGI、核聚变发电、人类未来

⭐⭐⭐⭐4 🇨🇳 · 今天

?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2Fow6przZuPIHP0Gcz8TtJwy0VIHUUhJra1aW5D0F2bmWNQbUkhNqhaGWHUej0QQDoVoTdz2k8Tu00jjHviaVYlSQ%2F300%3Fwx_fmt%3Dpng%26wxfrom%3D19&valid=true)


应战DeepSeek, OpenAI紧急上线o3-mini!价格打骨折,免费用户也能用

⭐⭐⭐⭐4 🇨🇳 · 今天

?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FqpAK9iaV2O3udFibzXZiaM3RWnnARYZbTyUooMUia19GzOiaICsibHeaEYib9Hw3ACnstRHq0pNbIL3D0FocWhUy1CgBw%2F640%3Fwx_fmt%3Djpeg%26from%3Dappmsg)


探索更强中文Embedding模型:Conan-Embedding

⭐⭐⭐⭐4 🇨🇳 · 今天

?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2Fj3gficicyOvasVeMDmWoZ2zyN8iaSc6XWYj79H3xfgvsqK9TDxOBlcUa6W0EE5KBdxacd2Ql6QBmuhBJKIUS4PSZQ%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg)


新一代 Agentic AI 智能体,助力 Android 开发 | Google I/O你好,我是朱涛。今天我们来聊聊 - 掘金

⭐⭐⭐⭐4 🇨🇳 · 今天

新一代 Agentic AI 智能体,助力 Android 开发 | Google I/O你好,我是朱涛。今天我们来聊聊 - 掘金


新一代深度学习编译技术变革和展望

⭐⭐⭐⭐4 🇨🇳 · 今天

本文总结对于深度学习编译领域过去两年的思考和未来展望。新一代架构一直是我们核心关注的主题,这里提到的各个特性也都已重构完成或者进行中。TVM FFI去年逐渐成熟,TensorIR本身刚被合并到主干,后续metaschedule陆续进入主干。


来自 OpenAI 离职员工的爆料:关于 OpenAI 的一些思考

⭐⭐⭐⭐4 🇨🇳 · 今天

?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FSib7IezOlBctSYVw9IASbOMl6iakmOyVggRG5q4v2SuQM01TdoQKpwtOVLWTlFRWXzbAAuwVSpPsgSAX65ufxGCg%2F640%3Fwx_fmt%3Djpeg%26from%3Dappmsg%26randomid%3Djtyc449h%26watermark%3D1)


淘宝订单列表Fragment转场动画卡顿解决方案

⭐⭐⭐⭐4 🇨🇳 · 今天

如何应对产品形态与产品节奏相对确定情况下转变为『在业务需求与产品形态高度不确定性的情况下,如何实现业务交付时间与交付质量的确定性』。本专题《淘宝交易终端架构探索》是我们摸索出的部分实践总结,欢迎大家一起交流进步。


深度解析:算力巨轮的引擎 —— 从SIMD到SIMT以及GPU如何统治AI时代

⭐⭐⭐⭐4 🇨🇳 · 今天

摘要: 当我们在《赛博朋克2077》的夜之城中流连忘返,或者惊叹于 ChatGPT 生成的精妙回答时,很少有人意识到这背后正在进行着怎样规模的数字狂欢。为了支撑现代图形渲染和人工智能,GPU 架构经历了一场从"方阵士兵"到"特种部队"的静默革命。本文将深入解剖 GPU 的微观架构,从 SIMD 的物理局限到 SIMT 的逻辑突围,并揭示 GPGPU 是如何凭借"极度并行"的哲学,成为现代 AI 产业的心脏。


科技爱好者周刊#301:OpenAI 的图书馆工位

⭐⭐⭐⭐4 🌐 · 今天

[需翻译] 本杂志开源^[1]^,欢迎投稿^[2]^。另有《谁在招人》^[3]^服务,发布程序员招聘信息。合作请邮件联系^[4]^(yifeng.ruan@gmail.com^[5]^)。


科技爱好者周刊#336:面对 AI,互联网正在衰落

⭐⭐⭐⭐4 🌐 · 今天

[需翻译] 本杂志开源^[1]^,欢迎投稿^[2]^。另有《谁在招人》^[3]^服务,发布程序员招聘信息。合作请邮件联系^[4]^(yifeng.ruan@gmail.com^[5]^)。


科技爱好者周刊(第234期):AI 聊天有多强?

⭐⭐⭐⭐4 🇨🇳 · 今天

Cubox 收藏 — 科技爱好者周刊(第234期):AI 聊天有多强?


终端大模型操作系统的架构、优化与展望

⭐⭐⭐⭐4 🇨🇳 · 今天

通过本地化搭载大模型,终端设备的智能能力将获得飞跃式提升,铸造移动计算的下一个黄金时代,对学术界和产业界都是巨大的机遇。


编译器优化那些事儿(22):LLM for Vectorization

⭐⭐⭐⭐4 🇨🇳 · 今天

随着大语言模型(Large Language Model, LLM)技术的迅猛发展,其应用已从通用领域快速渗透至编译技术等专业场景。本文将聚焦大模型在编译优化中的创新实践,重点探讨基于大模型的自动向量化的优化方法及其实现机制。


谈谈ChatGPT 背后的核心技术论文

⭐⭐⭐⭐4 🇨🇳 · 今天

Cubox 收藏 — 谈谈ChatGPT 背后的核心技术论文


Google Gemma-4-31B 模型被彻底破解

@Lonely__MH · ⭐⭐⭐3 🇨🇳 · 今天

Google 最新 Gemma-4-31B 基础模型出现越狱版本 Gemma-4-31B-JANG_4M-CRACK,HarmBench 得分 93.7%(149/159)。采用 18GB 混合精度 MLX 量化,支持 Apple Silicon,原生支持视觉多模态。已在 Hugging Face 开放下载。

gemma jailbreak open-source harmbench safety


Android Developers Blog: Gemini in Android Studio for businesses: Develop with confidence, powered b...

⭐⭐⭐3 🌐 · 今天

Android Developers Blog: Gemini in Android Studio for businesses: Develop with confidence, powered b... Read in Cubox
Read Original Posted by Sandhya Mohan -- Product Manager To empower Android developers at work, we're excited to announce a new offering of Gemini in Android Studio for businesses. This offering is specifically designed to meet the added privacy, securit...

Gemini Android


ChatGPT 探索:Code Interpreter 高级指南

⭐⭐⭐3 🇨🇳 · 今天

ChatGPT 探索:Code Interpreter 高级指南 Code Interpreter (Alpha) 是一个实验性的 ChatGPT 模型,具备以下功能(如何开启,请参考 ChatGPT 重大更新:代码解释器即将推出,GPT-4 API 全面开放!): * 使用 Python 进行编程:模型内置一个 Python 解释器,可以运行 Python 代码。 * 处理上传和下载:支持将文件上传到当前对话工作区,并下载工作结果。 * 沙箱化执行环境:解释器插件在一个受保护的执行环境中运行,包括防火墙和临时磁盘空间。 * 持久会话:代码由解释器插件在一个持久的会话中进行评估,会话在聊天...

gpt-4 [] chatgpt


ChatGPT研究框架(80页PPT)

⭐⭐⭐3 🌐 · 今天

ChatGPT研究框架(80页PPT) 研究框架系列合规声明:本文节选自正式入库研究报告 - end - 本文转自:计算机文艺复兴 微信公众号 会员申请 请在公众号内回复"个人会员"或"单位会员

[] chatgpt


OpenAI o3-mini:轻量级推理之王,STEM 领域新标杆!

@lencx · ⭐⭐⭐3 🇨🇳 · 今天

o3-mini 定位最具成本效益的推理模型,数学/科学/编程全面超越 o1-mini。支持联网搜索但不支持视觉。免费用户首次可试用推理模型。还讨论了 AI 应用形态(网页/本地/编程),以及 o3-mini 代码能力带来的半应用半编程新可能。

openai o3-mini reasoning coding 性价比


[2303.10130] GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models

⭐⭐⭐3 🌐 · 今天

[需翻译] [2303.10130] GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models


[译]AI算力民主化 第三部分:CUDA是如何成功的?

⭐⭐⭐3 🇨🇳 · 今天

若我们作为一个技术生态希望取得进展,就必须理解CUDA软件帝国 是如何取得如此统治地位的。表面上,替代方案确实存在------AMD的ROCm、Intel的oneAPI、基于SYCL的框架------但现实中,CUDA仍然是GPU计算领域无可争议的王者


[译]AI算力民主化 第二部分:究竟何为“CUDA”?

⭐⭐⭐3 🇨🇳 · 今天

过去一年间,似乎所有人都开始热议CUDA:它被誉为深度学习的支柱技术,是新兴硬件难以匹敌的根本掣肘,更是英伟达(NVIDIA)构建技术护城河、实现市值飙升的核心密码。DeepSeek的突破却带来了惊人启示:其成功的关键在于"绕开"CUDA,直接调用PTX底层指令...但这究竟意味着什么?虽然行业普遍渴望打破技术垄断,但我们必须先透彻理解对手的本质,才能制定破局之策。


[译]AI算力民主化 第五部分:CUDA C++替代方案(如OpenCL)现状如何?

⭐⭐⭐3 🇨🇳 · 今天

生成式AI或许是新生事物,但GPU不是!多年来,从OpenCL到SYCL再到OneAPI,许多人尝试用C++创建可移植的GPU编程模型。这些本是最有希望实现AI计算民主化的CUDA替代方案,但你可能从未听说过它们------因为它们未能与AI产生实际关联。


[译]AI算力民主化 第六部分:TVM和XLA等AI编译器现状?

⭐⭐⭐3 🇨🇳 · 今天

在AI硬件的早期,编写高性能GPU代码是一项虽繁琐但尚可管理的任务。工程师可以用C++手工编写所需关键操作的CUDA内核,而NVIDIA可以将这些内核集成到cuDNN等库中,以巩固其生态锁定。但随着深度学习的发展,这种方法彻底崩溃了。


[译]AI算力民主化 第四部分:CUDA虽为现有主导者,但它真的完美吗?

⭐⭐⭐3 🇨🇳 · 今天

要回答CUDA是否"优秀"这个问题,实际比听上去困难得多。我们讨论的是其原始性能?功能集?还是其对AI发展领域的更广泛影响?CUDA是否"优秀"取决于你询问的对象以及他们的具体需求


[译]AI计算民主化 第一部分:DeepSeek对AI 的影响

⭐⭐⭐3 🇨🇳 · 今天

> 在Denis的newsletter36中看到Chris Lattner的AI计算民主化系列的第二部分,看的心潮澎湃,特翻译出来,深入学习一下。 DeepSeek的最新突破颠覆了人们对AI算力需求的传统认知,表明通过更好地利用硬件可以显著减少对昂贵GPU的依赖。


claude code's DX is too good. and that's a problem. | thinking out loud

⭐⭐⭐3 🌐 · 今天

[需翻译] claude code's DX is too good. and that's a problem. | thinking out loud


iPhone 17 不支持 AI Agent,但邪修的智谱不管

⭐⭐⭐3 🇨🇳 · 今天

它支持了抖音、小红书、美团、京东等 40+ 高频应用,平时点外卖、订机票、查房源、预约健康服务,它都能搞定。


vLLM 深度解析:Deekseek and vLLM -1

⭐⭐⭐3 🇨🇳 · 今天

本文资料来自vLLM Office Hours第20次会议的记录,时间是2025年2月27日,主题是要讨论vllm 对于deepseek的更新,内容丰富。


vLLM 深度解析:production stack

⭐⭐⭐3 🇨🇳 · 今天

本文资料来自vLLM Office Hours第21次会议的记录,时间是2025年3月6日,主题是vLLM生产堆栈的深度探讨。主讲人包括Red Hat的Michael Goin和Yihua Cheng。会议内容涉及vLLM的最新动态、production stack的架构、性能优化、未来路线图等。


一家投资机构关于ChatGPT的内部讨论会

⭐⭐⭐3 🇨🇳 · 今天

"今天叫大家来,是组织大家讨论下ChatGPT的投资机会。ChatGPT可能对各行业产生颠覆性影响就不用我多说了吧。希望大家集思广益,从各自专业的投资领域谈谈chatgpt对未来投资产生的潜在影响。每个投资经理必须重视ChatGPT,现在不投资ChatGPT就等于20年前不在深圳买房。"


一键拯救大模型的前端审美能力

⭐⭐⭐3 🇨🇳 · 今天

如果我们也想要包括GPT-5.2-Codex、GLM-4.7、M2.1在内的其他主流模型也拥有审美能力,怎么办?是否有快速提升他们前端审美能力的方法呢?


一键让你的Claude Code拥有所有世界顶级Agent,并卷死它自己

⭐⭐⭐3 🇨🇳 · 今天

其他的Claude Code高手晒过类似这样的截图---满屏都是花花绿绿的Sub Agent在工作,并且工作质量相当高?


不用数学和代码,解释下ChatGPT算法原理

⭐⭐⭐3 🇨🇳 · 今天

这一段时间花了挺长的时间开始看ChatGPT的算法原理,有了一些新的认知,mark了一些算法书,对ChatGPT和OpenAI有了更多的尊重。


为开发者开启 Gemini 时代新篇章

⭐⭐⭐3 🇨🇳 · 今天

我们推出的 Gemini 2.0 Flash 体验版为开发者带来更具沉浸感和交互性的应用环境。同时,借助全新的编码智能体 Jules,开发者可以更高效地执行任务和优化开发流程。


从Claude 4发布和Windsurf并购案,看AI的终局

⭐⭐⭐3 🇨🇳 · 今天

?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FenzGz9ficm74gcmRktqtwxtjXM0Tx4iaQHmjmj7T8ZlBtk6icnLcgEqgGZy7qX3UCTVuQRyourFYZ4Kxe1V2jAl1w%2F300%3Fwx_fmt%3Dpng%26wxfrom%3D19&valid=false)


他们聊的不是产品,是未来:Claude Code 团队这期播客太震撼了

⭐⭐⭐3 🇨🇳 · 今天

今天读到Claude Code团队的一期播客,极其有共鸣,忍不住要来和大家分享。可以说,这是近期我读到的最好的产品思考,没有之一。


你无法用 AI 建立护城河 [译] | 宝玉的分享

⭐⭐⭐3 🇨🇳 · 今天

去年春天,我们写过一篇名为 《你无法用 AI 建立护城河》 (参见附录)的文章。那篇文章提到,虽然 Prompt 工程很重要,但由于在 LLM 上进行实验非常容易,想靠 Prompt 工程来建立长期壁垒并不现实。因此,要想实现差异化,必须专注于应用所能访问的数据质量以及对这些数据的使用方式。


使用 Gemini Pro 高效开发应用

⭐⭐⭐3 🇨🇳 · 今天

欢迎您使用 Gemini Pro 构建 AI 驱动的功能和 Android 应用,助您简化流程、高效开发。


使用Chat gpt提高Android开发效率

⭐⭐⭐3 🇨🇳 · 今天

?imageUrl=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2Fhfx5bHOBa3LO0nOWkGjxbBotFhgoWP69syZGtd0kiaACr70wE9H0GEMdEeiackfxWX9iah7mnN1ics1qf1Sib3SW6pw%2F640%3Fwx_fmt%3Dpng "null") logo


保姆级教程:利用大模型与高德地图API,轻松实现查找附近咖啡店

⭐⭐⭐3 🇨🇳 · 今天

我们可以轻松地结合OpenAI的大模型和高德地图API,实现查找某个地址附近咖啡店的功能。这不仅可以提升我们的开发效率,也为我们提供了强大的工具来应对各种实际需求。


关于AI的思考:如何在AI时代看清楚自己的价值

⭐⭐⭐3 🇨🇳 · 今天

开篇说明:这篇文章我断断续续写了快三周时间,写这篇文章的出发点是在AI出来快两年的时间里,我也一直在思考AI和我的关系,看着AI从GPT3.5的曝光大于实用,到GPT4的惊艳,再到Claude3.5回归实用,我认为只有深入的了解和AI的关系,才能更好的使用AI,当我在看了很多影响自己的AI文章后,发现很多打动我的观点都聚集到了一起,我将大量的文章按照自己的理解和脉络重新整合,试图表达出自己当下对于AI的关系


其实关于 ChatGPT plugins 的大部分 myth

⭐⭐⭐3 🇨🇳 · 今天

其实关于 ChatGPT plugins 的大部分 myth,读 OpenAI 这个简短的开发文档都可以得到解答 [1]。


听了Andrej Karpathy最新2小时访谈,我对Agent彻底祛魅了

⭐⭐⭐3 🇨🇳 · 今天

两天前,Andrej Karpathy 上了 Dwarkesh 的播客。YOU管上有视频版,周末我把这期播客过了两遍,信息密度极高。他的核心结论可以用一句话概括:Agent 的发展还需要十年


在 ChatWise 中使用 MCP 工具

⭐⭐⭐3 🇨🇳 · 今天

开发者可以根据 MCP 规范实现一些服务 (server),然后模型可以通过这些服务获取额外的能力和上下文,比如使用网络搜索、操控外部浏览器等等。


大语言模型 | LLMBook-zh

⭐⭐⭐3 🇨🇳 · 今天

作者:赵鑫,李军毅,周昆,唐天一,文继荣


如何使用 Claude Code 的每个功能

⭐⭐⭐3 🇨🇳 · 今天

> 作为 Claude Code 的深度用户,看到这篇文章《How I Use Every Claude Code Feature》觉得非常好,他详细介绍了Claude Code中很多高级功能的作用以及使用技巧,DD也收获颇丰,所以转过来推荐大家一起学习一下。 > > 下面是本篇文章的翻译,根据实际情况选择阅读。原文链接:https://blog.sshh.io/p/how-i-use-every-claude-code-feature


忘掉《Her》吧,诺兰旧作《记忆碎片》才是LLM Agent的必修课

⭐⭐⭐3 🇨🇳 · 今天

当 OpenAI 的 CEO Sam Altman 被问及他最爱的人工智能电影时,答案几乎总是 Her。


我们仍未知道那天所见的ChatGPT有多可怕

⭐⭐⭐3 🇨🇳 · 今天

Cubox 收藏 — 我们仍未知道那天所见的ChatGPT有多可怕


我所了解的 ChatGPT:二次开发;有何限制;对未来的影响

⭐⭐⭐3 🇨🇳 · 今天

前言OpenAI 的服务注册绑卡GPT-3 与 GPT-3.5我的进展ChatGPT 的限制4097 toke…


我把Claude Code换成GLM-4.7用了6小时,我竟然没发现明显区别

⭐⭐⭐3 🌐 · 今天

[需翻译] 智谱可能是国内最早打"平替Claude"牌的AI厂商了,对于智谱的新模型,我也毫不犹豫用Claude Code来测试,看看这次平替能力是否进步了。


手机上跑大模型,酷不酷

⭐⭐⭐3 🇨🇳 · 今天

2025 年的今天,大语言模型的发展非常迅速,除了 OpenAI 的 ChatGPT,其他各个厂子也都在发展自己的大语言模型,各式各样的 AI 助手满天飞。


手机能跑图生成和 LLM 大模型吗

⭐⭐⭐3 🇨🇳 · 今天

  1. 上个时代 AI 的核心应用是推荐系统,推荐是依赖海量数据的,海量数据只有服务端上存在,在推荐这主场景下客户端 AI 上能做的事很少,发展得比较吃力。 2. 生成式 AI 时代,最大的应用就是模型本身,只有训练时依赖海量数据,使用时并不依赖数据,那理论上只要客户端硬件资源足够,在客户端使用,跟在服务端使用,场景和效果是一致的。 3. 生成式 AI 在端上跑模型,最大的优势是成本 。成本是当前生成式 AI 应用除了效果以外第二大关键因素,在用户客户端上跑模型,对服务提供...

最新Chatgpt微信机器人搭建教程

⭐⭐⭐3 🌐 · 今天

[需翻译] ChatGPT 以其强大的信息整合和对话能力惊艳了全球,在自然语言处理上面表现出了惊人的能力。这么强大的工具我们都想体验一下,那么 ChatGPT 怎么用呢?本文将给你逐步详细介绍。


最新访谈| 乔姆斯基谈ChatGPT与教育

⭐⭐⭐3 🌐 · 今天

[需翻译] 现在,由于ChatGPT的泛滥,美国的很多大学已经打响了ChatGPT反击战------重设课程,提前预防!


最近感觉AI真是特别好的学习工具,我目前主要用的是谷歌的Gemini和NotebookLM

⭐⭐⭐3 🇨🇳 · 今天

最近感觉AI真是特别好的学习工具,我目前主要用的是谷歌的Gemini和NotebookLM。用他们来解决我几个学习需求。


理解llama.cpp怎么完成大模型推理的

⭐⭐⭐3 🇨🇳 · 今天

Understanding how LLM inference works with llama.cpp


用 Gemini API 开始你的 AI 之旅

⭐⭐⭐3 🇨🇳 · 今天

去年,Google 宣布合并旗下两大 AI 实验室,成立 Google DeepMind。同时,他们开始研发迄今为止最大的模型——Gemini 多模态大语言模型。


给公司全员送了iPhone 17 Pro Max,也分享下我在AI时代创业的10条感悟。

⭐⭐⭐3 🇨🇳 · 今天

本来是想图省心给所有人买iPhone 17 Pro Max星光橙的,但是有小伙伴说自己的手小握不住,不想要Pro Max,有些又说只想要银色不想要橙色,所以我们还提前以问卷的形式做了一下小小的调研,确保大家都能拿到自己喜欢的机型。


聊天GPT 3.5 api chatGPT私有化部署

⭐⭐⭐3 🇨🇳 · 今天

PHP版调用OpenAI的API接口进行问答的Demo,代码已更新为调用最新的gpt-3.5-turbo模型, ChatGPT3.5 API 服务 (那是, OpenAI 网页上使用的模型), 允许多个ChatGPT账号协同工作,构建对外API接口服务.


解读ChatGPT背后的技术重点:RLHF、IFT、CoT、红蓝对抗

⭐⭐⭐3 🇨🇳 · 今天

近段时间,ChatGPT 横空出世并获得巨大成功,使得 RLHF、SFT、IFT、CoT 等这些晦涩的缩写开始出现在普罗大众的讨论中


重磅更新|Android Studio Otter 3:LLM架构全面升级,AI开发效率直接翻倍

⭐⭐⭐3 🇨🇳 · 今天

谁懂啊!作为天天和Android Studio打交道的开发者,我们对AI辅助开发的需求就一个:灵活、高效、不添乱。


闲谈丨一名AI体验者的自述当年ChatGPT 3横空出世的时候,我对它不屑一顾,心想这不就是超大知识库的复读机么。如今, - 掘金

⭐⭐⭐3 🇨🇳 · 今天

闲谈丨一名AI体验者的自述当年ChatGPT 3横空出世的时候,我对它不屑一顾,心想这不就是超大知识库的复读机么。如今, - 掘金


面向 AI 的编程:是时候该坐下来应对不确定性了

⭐⭐⭐3 🇨🇳 · 今天

前段时间一直在做「面向 AI 的编程」——其实就是调用 OpenAI 和开源的 LLM。写本文的动机是总结在这段时间里涉及到的各类「技巧」。 我觉得随着时间的发展,未来很多「技巧」会失去价值。但在当下,如果你和我一样,需要在程序代码里嘱咐 LLM 做点什么事情,那么这篇文章应该可以给你一些帮助。


👋 Welcome | Learning Prompt

⭐⭐⭐3 🇨🇳 · 今天

  • 本教程不是 prompt 大全,如果你预期是找到能直接用的 prompt,建议你谷歌找一找。本教程更多地是教你方法,以及解释这些方法为何有效。 * 本教程不是权威指南,在这个领域我也只是学生。

由 OpenClaw 每日自动维护 · 2 篇有全文