张刚 – Page 7 – 张刚AI拆解

不懂原理难用好AI，三分钟看懂AI的思考逻辑

张刚 / 2026年1月27日

如果把生成式AI（AIGC）比作一盏神灯，很多人只学会了“擦灯许愿”，却不知道灯神是如何凭空变出答案的。这种“不知其所以然”的使用方式，不仅容易被AI的错误信息误导，更错过了借助AI提升认知的机会。其实，哪怕是最复杂的大模型，其核心逻辑也简单得像一个 “超级接龙游戏” 。一、 AI不会思考，它只是在“猜”下一个词你可能会惊叹于AI写出的万字论文或代码，但请记住： AI没有意识，它不知道自己在说什么。生成式AI的本质是一个 “概率预测机器” 。它的工作原理可以简化为：就像你玩“成语接龙”，看到“一心一意”，大脑会自动联想“意气风发”或“意气相投”。AI做的事情类似，只不过它考虑的不是几个成语，而是万亿级别的文本规律。它通过复杂的数学模型（Transformer）计算每个词在当前语境下出现的概率，然后选择概率最高的那个词输出。二、为什么AI会“一本正经地胡说八道”？这就引出了AI的一个著名缺陷—— “幻觉”（Hallucination）。既然是猜概率，AI的首要目标是 “通顺” ，而不是 […]

AI技术选型

岚迹（Lanjii）前后端分离企业级管理系统

张刚 / 2026年1月27日

岚迹（Lanjii）是一款基于 Spring Boot + Vue3 技术栈构建的现代化前后端分离企业级管理系统，遵循 MIT 开源协议，支持商用且无复杂依赖，开箱即用，可快速助力企业或个人搭建 CRM、OA、博客等各类 Web 后台系统，也适用于企业项目开发与个人学习实践。一、核心技术栈岚迹采用主流且稳定的技术组合，兼顾性能、扩展性与开发效率，具体技术栈如下：技术类别技术框架/工具版本信息核心作用后端框架 Spring Boot 3.3.12（近期升级至 3.5.9）

AI技术选型

OpenBMB 与 UltraRAG 开源产品全解

张刚 / 2026年1月26日

一、OpenBMB 开源社区概述 OpenBMB（Open Lab for Big Model Base）是由清华大学自然语言处理实验室(THUNLP) 和面壁智能共同发起的大模型开源社区，致力于打造大规模预训练语言模型库与相关工具链，降低百亿级以上大模型的训练、微调与推理门槛，推动大模型生态标准化、普及化和实用化。核心使命与定位 ● 构建大模型基础设施，加速大模型技术落地 ● 降低大模型使用门槛，让技术惠及更多开发者 ● 推动大模型开源社区建设，促进技术交流与创新主要开源项目 ● MiniCPM系列：轻量级高性能大模型，适合端侧部署 ● Eurux系列：推理性能突出的开源大模型，被称为”理科状元” ● UltraRAG：基于MCP协议的低代码RAG框架（本文重点介绍） ● BMTools：大模型工具学习引擎，支持接入16000+真实API ● AgentCPM系列：端侧智能体模型，支持本地化深度调研与报告生成二、UltraRAG 框架深度解析

AI场景落地

AI能模仿你的图，但模仿不了你的脑：构建职业护城河

张刚 / 2026年1月24日

在AI绘画工具普及的当下，设计师面临的最大焦虑或许是“技能贬值”。毕竟，只需输入一段文字，AI就能在几秒内生成几十张风格各异的精美图片。然而，当我们将视角从“视觉呈现”转向“商业交付”，就会发现一个残酷的真相： AI能模仿你的图，但模仿不了你的“脑子”。一个典型的场景是：某连锁咖啡店需要一款新的logo。AI生成了无数张带有咖啡豆、绿叶和优雅曲线的图片，视觉效果堪称惊艳。但如果你仔细审视这些方案，会发现其中大部分在缩小到手机图标尺寸时完全无法识别，或者颜色组合在印刷时会产生严重的色差。AI完成了“画得好看”的任务，却完全忽略了“商业落地”的逻辑。这就是设计师真正的护城河所在——那些无法被数据训练出来的隐性资产。一、解决问题的逻辑闭环 AI是基于概率的预测模型，它擅长模仿“是什么”，但不理解“为什么”。当客户提出“要高端感”时，AI可能会堆砌黑金配色和大理石纹理。而资深设计师的大脑里，运行的是一套严密的逻辑推演：高端感的本质是“稀缺性”与“克制”，因此需要通过留白、高对比度和独特的排版节奏来实现，同时还要考虑目标受众的审美阈值。这种从需求拆解到方案落地的逻辑闭环，是AI目前无法企及的。二、对甲方的“商业同理心” 很多时候，甲方的需求是模糊甚至矛盾的。他们可能会说“要大气一点，但预算有限”，或者“要创新，但不能太出格”。AI无法处理这种语义冲突，它只会机械地执行指令。而优秀的设计师能通过过往的项目经验，敏锐地捕捉到甲方未说出口的潜台词：“预算有限”意味着要控制印刷成本，“不能太出格”意味着要符合行业的既有认知。这种对商业语境的理解和对人性的洞察，我们称之为“商业同理心”，这是通过数百次的提案被拒和深夜改稿沉淀下来的直觉。三、跨领域的知识整合在设计一个医疗APP界面时，设计师不仅要懂UI规范，还要懂医疗流程、患者心理和HIPAA合规要求。在设计一个金融网站时，不仅要美观，还要传递出“信任”与“专业”的信号。AI可以生成医疗相关的图片，但它无法将金融的严谨性与互联网的易用性无缝融合。这种跨行业的知识储备和整合能力，使得设计师能够在不同的商业语境下游刃有余。 AI确实带来了技术平权，让“画画”这件事变得前所未有的简单。但在这个时代， “会画画”已经不再是稀缺技能，“会解决问题”才是。未来的设计师，不再仅仅是“画图匠”，而是“视觉策略师”。他们的核心竞争力，不在于手中的画笔或鼠标，而在于大脑中对商业逻辑的理解、对用户心理的洞察以及跨领域知识的融会贯通。这些装在“脑子”里的隐性资产，才是设计师在AI时代最坚固的职业护城河。

AI技术选型

FlashMLA：DeepSeek开源的大模型推理加速核心引擎

张刚 / 2026年1月23日

FlashMLA（Multi-head Latent Attention Kernels）是由DeepSeek AI开发的高性能注意力计算内核库，专为英伟达Hopper架构GPU（H100/H800/H200/B200等）优化，旨在解决大模型推理中变长序列处理效率低的核心痛点，已在DeepSeek-V3和V3.2系列模型中大规模部署验证。一、核心定位与价值 FlashMLA是大模型推理的”性能加速器”，专注于优化Transformer架构中的多头潜注意力（MLA）计算，通过硬件级优化与算法创新，将高端GPU的算力与带宽利用率提升至极限，同时大幅降低显存占用，为大模型生产环境部署提供关键技术支撑。二、核心功能 FlashMLA提供完整的注意力计算解决方案，覆盖大模型训练与推理全流程：功能模块具体实现特点稀疏注意力内核 1. 预填充阶段token级稀疏注意力2. 解码阶段token级稀疏注意力（支持FP8 KV缓存）适配DeepSeek Sparse Attention

AI技术选型

Logto 轻量级 Auth0 替代品

张刚 / 2026年1月22日

Logto是Silverhand公司推出的现代开源身份认证与访问管理（CIAM/IAM）基础设施，核心价值在于以OIDC/OAuth 2.1/SAML为标准，为SaaS、AI应用等提供开箱即用的认证授权能力，兼顾快速集成与企业级安全，支持本地部署与完全自定义，同时提供云托管版本，可替代Auth0等商业方案。核心功能 1. 认证与登录支持邮箱/短信无密码登录、社交登录（微信、Google、GitHub等30+）、企业SSO（SAML/OIDC）、MFA（TOTP/安全密钥/备用码）、邀请注册、账号绑定。 a. 开箱即用且高度可定制的认证UI，支持自定义CSS与流程，适配Web/SPA/移动端/M2M场景。 2. 授权与访问控制RBAC（用户/组织级）、JWT/不透明令牌校验、自定义令牌声明、API防护，适配多租户隔离需求。 a. 组织模板、成员邀请、按组织启用MFA，支持即时开通（JIT）与租户级登录体验定制。 3. 用户与合规管理用户模拟、创建/挂起/邀请、审计日志、用户迁移，支持数据隔离与全程TLS加密。 a. 符合SOC 2 Type II认证，内置数据加密与隐私保护机制，适配GDPR等合规要求。 4. 集成与生态30+框架SDK（React/Vue/Next.js/Flutter/Go/Python等），支持无代码集成与自定义连接器。 a. 兼容OIDC/OAuth 2.1/SAML，可对接主流IdP（Azure AD/Okta/Google Workspace）与社交平台。适用场景场景核心价值

Author name: 张刚

不懂原理难用好AI，三分钟看懂AI的思考逻辑

岚迹（Lanjii）前后端分离企业级管理系统

OpenBMB 与 UltraRAG 开源产品全解

AI能模仿你的图，但模仿不了你的脑：构建职业护城河

FlashMLA：DeepSeek开源的大模型推理加速核心引擎

Logto 轻量级 Auth0 替代品