Softmax 从入门到精通：多分类激活函数的优雅解法

张开发

• 2026/4/18 0:06:38 • 15 分钟阅读

分享文章

Softmax 从入门到精通多分类激活函数的优雅解法一、 SoftmaxSigmoid 的「进阶升级版」二、 Softmax 核心逻辑概率归一化 \ 最大概率决策1\. 核心特性记住这 2 点就够了2\. 通俗案例理解三、 Softmax 数学原理公式 \ 分步计算1\. 标准公式2\. 分步计算演示5 个输入值举例四、 Mermaid 流程图Softmax 网络计算链路五、代码实践Softmax 手动实现 \ 验证1\. 核心代码含维度控制2\. 代码关键说明六、常见激活函数对比选对函数少走弯路七、激活函数终极选择规则背会直接用1\. 隐藏层选择2\. 输出层选择八、✨ 总结Softmax 就是多分类的「最优解」在深度学习的世界里分类任务永远是绕不开的核心场景。从二分类的简单判断到多分类的精细划分激活函数就像神经网络的「决策大脑」赋予模型非线性表达能力。而当我们需要处理3 类、5 类、10 类甚至上百类的复杂预测时Softmax便是那个无可替代的最优解✨。很多人初识 Softmax都会疑惑它和 Sigmoid 到底有什么关系为什么多分类一定要用它今天我们就从零拆解 Softmax 的原理、计算、代码实践再串联激活函数的选择逻辑一次性吃透这个多分类神器一、 SoftmaxSigmoid 的「进阶升级版」如果把二分类比作 \\「是非题」那多分类就是「多选题」\\。Sigmoid 专注解决二分类输出 0~1 之间的数值代表「是 / 否」的概率完美适配if else二元判断。但现实场景中我们需要判断3 种、4 种、N 种类别单纯的if else不够用嵌套逻辑又繁琐这时候就需要 Softmax 登场。Softmax 可以理解为 \\「Sigmoid 在多分类场景的推广」它不只是做简单的数值映射而是把所有分类的输出转化为概率和为 1\\的标准化结果让模型的决策更直观、更严谨。二、 Softmax 核心逻辑概率归一化最大概率决策Softmax 的设计理念完美贴合人类的决策习惯给每个选项打分分数越高越可能是正确答案且所有分数加起来等于 100%。1. 核心特性记住这 2 点就够了概率归一化所有分类的输出概率之和 1即 100%最大概率决策概率最高的类别就是模型的最终预测结果。2. 通俗案例理解假设我们要判断一个人的性别类别男、女、中性预测概率男 0.7女 0.2中性 0.1概率和0.70.20.1 1✔️最终决策概率最高的「男」就是预测结果。再比如手写数字识别10 分类模型输出 10 个概率值加和为 1数值最大的位置就是识别出的数字。三、 Softmax 数学原理公式分步计算很多人觉得 Softmax 公式复杂其实拆解后超简单1. 标准公式对于输入向量Z [ z 1 , z 2 , . . . , z n ] Z [z_1, z_2, ..., z_n]Z[z1,z2,...,zn]第i ii个元素的 Softmax 输出为分子e z i e^{z_i}ezi→ 对输入值做指数变换放大差异、保证非负分母所有输入值指数的累加和→ 实现归一化让总概率 1。2. 分步计算演示5 个输入值举例假设输入Z [ 1 , 2 , 3 , 4 , 5 ] Z [1, 2, 3, 4, 5]Z[1,2,3,4,5]计算每个值的指数e 1 、 e 2 、 e 3 、 e 4 、 e 5 e^1、e^2、e^3、e^4、e^5e1、e2、e3、e4、e5求指数累加和S e 1 e 2 e 3 e 4 e 5 S e^1e^2e^3e^4e^5Se1e2e3e4e5逐个算概率第 1 个概率e 1 / S e^1 / Se1/S第 2 个概率e 2 / S e^2 / Se2/S...第 5 个概率e 5 / S e^5 / Se5/S最终所有概率相加 1。四、 Mermaid 流程图Softmax 网络计算链路为了更清晰理解 Softmax 在神经网络中的位置我们用流程图展示完整计算过程输入数据 Input输入层 Input Layer隐藏层 Hidden Layer线性输出层Softmax 激活类别1概率类别2概率类别3概率概率和 1取最大概率 → 最终类别图表说明数据从输入层进入经过隐藏层提取特征后得到线性输出再经过 Softmax 激活转化为多分类概率所有概率和为 1最终选取概率最大的类别作为预测结果这就是 Softmax 的完整工作流。五、代码实践Softmax 手动实现验证光说不练假把式我们用 Python 手动实现 Softmax验证「概率和为 1」的核心特性。1. 核心代码含维度控制importnumpyasnpdefsoftmax(z,axis0): Softmax 实现 :param z: 输入张量/数组 :param axis: 计算维度0按行1按列 :return: 归一化概率 # 指数变换防止溢出减去最大值exp_znp.exp(z-np.max(z,axisaxis,keepdimsTrue))# 归一化求概率probexp_z/np.sum(exp_z,axisaxis,keepdimsTrue)returnprob# 测试1 维数据4 分类z1np.array([0.2,0.335,0.1,0.46])prob1softmax(z1)print(1维概率,prob1)print(概率和,np.sum(prob1))# 输出 ≈ 1# 测试2 维数据按行计算z2np.array([[0.1,0.13,0.05],[0.2,0.3,0.5]])prob2softmax(z2,axis1)print(2维概率\n,prob2)print(每行概率和,np.sum(prob2,axis1))# 每行输出 ≈ 12. 代码关键说明axis0按列计算概率和axis1按行计算概率和多分类最常用减去np\.max\(z\)防止指数计算溢出保证数值稳定性。运行代码后你会发现所有概率输出的和严格等于 1完美验证 Softmax 的归一化特性✅。六、常见激活函数对比选对函数少走弯路Softmax 不是唯一的激活函数不同场景对应不同选择我们用表格清晰对比激活函数核心作用取值范围优缺点适用场景Sigmoid二分类概率映射0~1梯度消失收敛慢二分类输出层Tanh数据中心化-1~1收敛比 Sigmoid 快隐藏层备选ReLU非线性激活0~∞收敛最快易神经元死亡隐藏层首选LeakyReLU解决 ReLU 死神经元-∞~∞保留负样本梯度ReLU 失效时用Softmax多分类概率归一化0~1和为 1无梯度消失决策直观多分类输出层表格说明这是深度学习最常用的 5 种激活函数从功能、范围、优缺点到适用场景全覆盖是面试和工程实践的「速查手册」。七、激活函数终极选择规则背会直接用工程实践中不用纠结试错按照这个优先级选择效率拉满1. 隐藏层选择ReLU LeakyReLU PReLU/RReLU Tanh SigmoidReLU 收敛最快90% 的场景直接用避免「Dead ReLU」神经元死亡梯度为 0参数无法更新ReLU 失效换 LeakyReLU负样本梯度设为 0.01。2. 输出层选择二分类任务 →Sigmoid多分类任务 →Softmax回归任务 → Identityf (x)x极少用八、✨ 总结Softmax 就是多分类的「最优解」Softmax 是 Sigmoid 的多分类推广核心是概率归一化最大概率决策所有分类概率和为 1计算逻辑简单数值稳定代码易实现支持 1 维 / 2 维数据按行 / 列灵活计算激活函数选择有章法隐藏层优先 ReLU输出层二分类用 Sigmoid、多分类用 Softmax。深度学习的多分类任务从图像识别到文本分类Softmax 都是标配。吃透它就等于掌握了神经网络分类的「半壁江山」。下次遇到多分类问题别犹豫直接上 Softmax

更多文章

前端开发 2026/4/18 0:06:08

从Arduino到STM32：手把手教你搞定I2C外设的硬件配置与软件避坑

从Arduino到STM32：I2C外设实战配置与高频问题解决方案 I2C总线作为嵌入式开发中最常用的通信协议之一，其简洁的两线制设计（SDA数据线和SCL时钟线）掩盖不了实际应用中层出不穷的配置难题。当OLED屏幕突然停止响应、温湿度传感器返回…

张开发

前端开发 2026/4/18 0:00:56

DDL急救包！2026论文降AI率实测：10款润色工具稳保安全区

现在写论文最怕的，已经不是查重了。怕什么？怕那个AIGC率太高。真的，越来越多学校开始抓AIGC检测报告了，重复率放一边，就看你AI痕迹多不多。我自己就是刚爬出坑的25届学姐，这坑我踩得死死的。怎么说呢&…

张开发

前端开发 2026/4/17 23:59:37

宝塔面板一键部署Unlock Music：解锁全网加密音乐格式实战

1. 为什么需要Unlock Music？ 作为一个音乐爱好者，我经常遇到这样的困扰：在某个音乐平台下载的付费歌曲，换个播放器就打不开了。比如QQ音乐下载的.qmc格式、网易云音乐的.ncm格式，这些加密音乐文件就像被锁在保险箱里&a…

张开发

前端开发 2026/4/17 23:57:24

KISS FFT：为什么这个500行代码的轻量级库能让你的信号处理项目起飞？

KISS FFT：为什么这个500行代码的轻量级库能让你的信号处理项目起飞？ 【免费下载链接】old-kissfft [DEPRECATED MIRROR] You want https://github.com/mborgerding/kissfft! 项目地址: https://gitcode.com/gh_mirrors/ol/old-kissfft 想象一下&a…

张开发

前端开发 2026/4/17 23:56:23

如何记录SQL谁修改了数据_添加更新人字段与触发器同步

最稳方式是用AFTER UPDATE触发器配合ORIGINAL_LOGIN()兜底，updated_by用sysname类型，需加IF UPDATE判断防递归，避免复杂逻辑。SQL Server 里怎么自动填 updated_by 字段？靠应用层写死用户名不靠谱，一出错就全乱&#x…

张开发

前端开发 2026/4/17 23:47:15

Opus 4.7“翻车“了？人家Anthropic根本不想争什么“最强“！

4月16日消息，最近AI圈可是炸开了锅，不少吹捧Claude的"粉丝"可能都要冷静一下了。据科技媒体The Decoder报道，消息人士透露，Anthropic正在准备推出新一代旗舰模型Claude Opus 4.7，并同步发布一款AI设计工具&a…

张开发

前端开发 2026/4/17 23:43:12

题解：AcWing 467 海港

本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法…

张开发

前端开发 2026/4/17 23:42:24

题解：洛谷 P2161 [SHOI2009] 会场预约

张开发

前端开发 2026/4/17 23:37:09

从期末试卷反推：AI导论老师最想考察的10个重点与5个易错点（附卷积神经网络计算详解）

从期末试卷反推：AI导论老师最想考察的10个重点与5个易错点（附卷积神经网络计算详解） 每次期末考试前，总有同学抱着厚厚的教材不知从何下手。作为经历过三次AI导论考试并担任过两年助教的"老油条"，我发现试卷…

张开发

前端开发 2026/4/17 23:36:51

风吸式太阳能杀虫灯

风吸式太阳能杀虫灯采用诱虫光源搭配风吸负压式杀虫技术，风机旋转形成负压力气旋，将靠近光源的害虫瞬间吸入回收器，使其吹干脱水灭活，有效避免传统电击式杀虫灯害虫撞灯后逃逸的问题。该方式不受虫体大小影响，可诱杀果…

张开发

前端开发 2026/4/17 23:33:43

一站式IT运维管理平台：NeatLogic ITOM 15分钟快速上手终极指南

一站式IT运维管理平台：NeatLogic ITOM 15分钟快速上手终极指南【免费下载链接】neatlogic-itom-all NeatLogic is a progressive ITOM platform offering ITOM solutions for users of various types and sizes. It includes features like ITSM, CMDB, continuous…

张开发

前端开发 2026/4/17 23:29:16

intv_ai_mk11应用场景：研发团队每日站会纪要自动生成与关键结论提炼

intv_ai_mk11应用场景：研发团队每日站会纪要自动生成与关键结论提炼 1. 研发团队的站会痛点每天早上9:30，技术团队都会准时开始15分钟的站会。每个成员轮流发言，汇报昨日进展、今日计划和遇到的障碍。这种敏捷开发实践虽然高效&#xff0c…

张开发

Softmax 从入门到精通：多分类激活函数的优雅解法

最新文章

显卡驱动彻底清理指南：Display Driver Uninstaller完全教程

LongMemEval 基准实测！Awareness 长时记忆能力登顶

SelectDB Enterprise 4.0.5：强化安全与治理，构建企业级实时分析与 AI 数据底座

备忘录：3 人，开发周期3 个月，团队日净收入约100 万 +

高压电缆户外终端接地环流在线监测装置｜1文讲清为什么要装它！

《论三生原理》系列：文化自信、知识范式重构与科技自主创新的思想运动源头？

推荐文章

手把手教你用NUCLEO-H743ZI2连接Arduino模块：从硬件选型到I2C通信实战

从‘能用’到‘好用’：我用这5个步骤，为我的智能小车电机选到了最合适的栅极驱动芯片

11.os模块、编解码、文件操作、try-except语句详解

公路车桥耦合振动程序（考虑路面不平整度）——两套模型介绍及操作指南

Umi-OCR完全指南：如何利用开源OCR工具实现高效文字识别

从理论到实践：基于MATLAB comm.RayTracingChannel的室内多径信道仿真全解析

相关文章

2025 AI写作革命：自定义API打造专属小说生成器

用GDAL和PyTorch搞定多光谱.tif图像训练Faster R-CNN（避坑全记录）

HC-SR501人体红外传感器：从参数解析到树莓派实战应用

2026年三维扫描仪选购指南：专业厂家如何选，这几点是关键

微信小程序项目目录结构优化指南：从tabBar报错看最佳实践

探索Feishin：打造个人专属的自托管音乐播放解决方案

分享文章

更多文章

从Arduino到STM32：手把手教你搞定I2C外设的硬件配置与软件避坑

DDL急救包！2026论文降AI率实测：10款润色工具稳保安全区

宝塔面板一键部署Unlock Music：解锁全网加密音乐格式实战

KISS FFT：为什么这个500行代码的轻量级库能让你的信号处理项目起飞？

如何记录SQL谁修改了数据_添加更新人字段与触发器同步

Opus 4.7“翻车“了？人家Anthropic根本不想争什么“最强“！

题解：AcWing 467 海港

题解：洛谷 P2161 [SHOI2009] 会场预约

从期末试卷反推：AI导论老师最想考察的10个重点与5个易错点（附卷积神经网络计算详解）

风吸式太阳能杀虫灯

一站式IT运维管理平台：NeatLogic ITOM 15分钟快速上手终极指南

intv_ai_mk11应用场景：研发团队每日站会纪要自动生成与关键结论提炼