《深度学习,统计学习,数学基础》AI算法工程师手册:50章一网打尽

发布于: 雪球转发:4回复:2喜欢:21

新智元推荐  

来源:专知

编辑整理:元子

【新智元导读】市面上很多人工智能相关的书籍。大部分的书,面向小白,内容深度不够;小部分教材书或者科研书,内容艰深,又过于复杂。那么有没有,面向算法工程师(程序员)人群的,面向有一定数学基础、算法基础,能够快速上手写代码的人群的人工智能手册呢?有的!而且免费开源,非常有程序员范!《AI算法工程师手册》你值得拥有!来 新智元AI朋友圈 和行业大咖讨论吧~

市面上很多人工智能相关的书籍。大部分的书,面向小白,内容深度不够;小部分教材书或者科研书,内容艰深,又过于复杂。那么有没有,面向算法工程师(程序员)人群的,面向有一定数学基础、算法基础,能够快速上手写代码的人群的人工智能手册呢?有的!而且免费开源,非常有程序员范!《AI算法工程师手册》你值得拥有!

作者Github:网页链接

手册地址: 网页链接

手册目录:

数学基础

1.线性代数基础

一、基本知识二、向量操作三、矩阵运算四、特殊函数

2.概率论基础

一、概率与分布二、期望和方差三、大数定律及中心极限定理五、常见概率分布六、先验分布与后验分布七、信息论八、其它

3.数值计算基础

一、数值稳定性二、梯度下降法三、二阶导数与海森矩阵四、牛顿法五、拟牛顿法六、 约束优化

4.蒙特卡洛方法与 MCMC 采样

一、蒙特卡洛方法二、马尔可夫链三、MCMC 采样

统计学习

0.机器学习简介一、基本概念二、监督学习三、机器学习三要素

机器学习的对象是:具有一定的统计规律的数据。

机器学习根据任务类型,可以划分为:

监督学习任务:从已标记的训练数据来训练模型。主要分为:分类任务、回归任务、序列标注任务。无监督学习任务:从未标记的训练数据来训练模型。主要分为:聚类任务、降维任务。半监督学习任务:用大量的未标记训练数据和少量的已标记数据来训练模型。强化学习任务:从系统与环境的大量交互知识中训练模型。

机器学习根据算法类型,可以划分为:

传统统计学习:基于数学模型的机器学习方法。包括SVM、逻辑回归、决策树等。这一类算法基于严格的数学推理,具有可解释性强、运行速度快、可应用于小规模数据集的特点。深度学习:基于神经网络的机器学习方法。包括前馈神经网络、卷积神经网络、递归神经网络等。这一类算法基于神经网络,可解释性较差,强烈依赖于数据集规模。但是这类算法在语音、视觉、自然语言等领域非常成功。

没有免费的午餐定理(No Free Lunch Theorem:NFL):对于一个学习算法A,如果在某些问题上它比算法B好,那么必然存在另一些问题,在那些问题中B比A更好。因此不存在这样的算法:它在所有的问题上都取得最佳的性能。因此要谈论算法的优劣必须基于具体的学习问题。

1.线性代数基础

一、线性回归二、广义线性模型三、对数几率回归四、线性判别分析五、感知机

2.支持向量机

一、 线性可分支持向量机二、线性支持向量机三、非线性支持向量机四、支持向量回归五、SVDD六、序列最小最优化方法七、其它讨论

3.朴素贝叶斯

一、贝叶斯定理二、朴素贝叶斯法三、半朴素贝叶斯分类器四、其它讨论

4.决策树

一、 原理二、 特征选择三、生成算法四、剪枝算法五、CART 树六、连续值、缺失值处理七、多变量决策树

5.knn

一、k 近邻算法二、 kd树

6.集成学习

一、集成学习误差二、 Boosting三、Bagging四、集成策略五、多样性分析

7.梯度提升树

一、提升树二、xgboost三、LightGBM

8.特征工程

一、缺失值处理二、特征编码三、数据标准化、正则化四、特征选择五、稀疏表示和字典学习六、多类分类问题七、类别不平衡问题

9.模型评估

一、泛化能力二、过拟合、欠拟合三、偏差方差分解四、参数估计准则五、泛化能力评估六、训练集、验证集、测试集七、性能度量七、超参数调节八、传统机器学习的挑战

10.降维

一、维度灾难二、主成分分析 PCA三、核化线性降维 KPCA四、流形学习五、度量学习六、概率PCA七、独立成分分析八、t-SNE九、LargeVis

11.聚类

一、性能度量二、原型聚类三、密度聚类四、层次聚类五、谱聚类

12.半监督学习

半监督学习一、生成式半监督学习方法二、半监督 SVM三、图半监督学习四、基于分歧的方法五、半监督聚类六、 总结

13.EM算法

一、示例二、EM算法原理三、EM算法与高斯混合模型四、EM 算法与 kmeans 模型五、EM 算法的推广

14.最大熵算法

一、最大熵模型MEM二、分类任务最大熵模型三、最大熵的学习

15.隐马尔可夫模型

一、隐马尔可夫模型HMM二、 HMM 基本问题三、 最大熵马尔科夫模型MEMM

16.概率图与条件随机场

一、概率图模型二、贝叶斯网络三、马尔可夫随机场四、条件随机场 CRF

17.边际概率推断

一、精确推断二、近似推断

18.主题模型

一、Unigram Model二、pLSA Model三、LDA Model四、LDA优化五、sentence-LDA六、模型讨论

深度学习

0.深度学习简介一、 介绍二、历史

深度学习: 计算机从经验中学习,以层次化的概念(concept)来理解世界。

从经验中学习:避免了人工指定 计算机学习所需的所有知识。

层次化的概念: 计算机通过从简单的概念来构建、学习更复杂的概念。

 如果绘制一张图来展示这些概念的关系,那么这张图是一个深度的层次结构,因 此称这种方法为深度学习。

1.深度前馈神经网络

深度前馈网络(deep feedfoward network)也称作前馈神经网络(feedforward neural network)或者多层感知机(multilayer perceptron:MLP),它是最典型的深度学习模型。卷积神经网络就是一种特殊的深度前馈网络。深度前馈网络也是循环神经网络的基础。

一、基础二、损失函数三、输出单元四、隐单元五、结构设计六、历史小记

2.反向传播算法

一、链式法则二、反向传播三、算法实现四、自动微分

3.正则化

一、参数范数正则化二、显式约束正则化三、数据集增强四、噪声鲁棒性五、早停六、参数相对约束七、dropout八、对抗训练九、正切传播算法十、其它相关

4.最优化基础

一、代价函数二、神经网络最优化挑战三、 mini-batch四、基本优化算法五、自适应学习率算法六、二阶近似方法七、共轭梯度法八、优化策略和元算法九、参数初始化策略十、Normalization十一、Online Learning

5.卷积神经网络:卷积神经网络convolutional neural network:CNN:是指那些至少在网络的某一层中使用了卷积运算来代替一般的矩阵乘法运算的神经网络。卷积神经网络专门处理具有类似网格结构的数据的神经网络。如:时间序列是一维网格,图像数据是二维网格。

一、卷积运算二、卷积层、池化层三、基本卷积的变体四、应用五、 历史和现状

5.1.CNN之图片分类

一、LeNet二、AlexNet三、VGG-Net四、Inception五、ResNet六、ResNet 变种七、SENet八、 DenseNet九、小型网络

6.循环神经网络

一、RNN计算图二、训练算法三、长期依赖四、常见 RNN 变种

7.Transformer

一、Transformer二、 Universal Transformer三、Transformer XL四、GPT五、BERT六、ERNIE七、XLNet八、MT-DNN九、BERT 扩展

8.词向量

一、向量空间模型 VSM二、LSA三、Word2Vec四、GloVe五、FastText六、ELMo七、变种

9.传统 CTR 预估模型

一、LR 模型二、POLY2 模型三、FM模型四、FFM模型五、GBDT-LR 模型六、FTRL模型七、LS-PLM 模型

10.工程实践指导原则

一、性能度量二、默认的基准模型三、决定是否收集更多数据四、选择超参数五、调试策略六、示例:数字识别系统七、数据预处理八、变量初始化九、结构设计

工具

CRF

CRF++一、安装二、使用三、Python接口四、常见错误

lightgbm

lightgbm使用指南一、安装二、调参三、进阶四、API五、Docker

xgboost

xgboost使用指南一、安装二、调参三、外存计算四、 GPU计算五、单调约束六、 DART booster七、Python API

scikit-learn

1.预处理

一、特征处理二、特征选择三、字典学习四、PipeLine

2.降维

一、PCA二、 MDS三、Isomap四、LocallyLinearEmbedding五、FA六、FastICA七、t-SNE

3.监督学习模型

一、线性模型二、支持向量机三、贝叶斯模型四、决策树五、KNN六 、AdaBoost七、梯度提升树八、Random Forest

4.模型评估

一、数据集切分二、性能度量三、验证曲线 && 学习曲线四、超参数优化

5.聚类模型

一、KMeans二、DBSCAN三、MeanShift四、AgglomerativeClustering五、BIRCH六、GaussianMixture七、SpectralClustering

6.半监督学习模型

一、标签传播算法

7.隐马尔可夫模型

一、Hmmlearn二、seqlearn

spark

1.基础概念

一、核心概念二、安装和使用三、 pyspark shell四、独立应用

2.rdd使用

一、概述二、创建 RDD三、转换操作四、行动操作五、其他方法和属性六、持久化七、分区八、混洗

3.dataframe使用

一、概述二、SparkSession三、DataFrame 创建四、 DataFrame 保存五、DataFrame六、Row七、Column八、GroupedData九、functions

4.累加器和广播变量

一、累加器二、广播变量

numpy

numpy 使用指南一、 ndarray二、 ufunc 函数三、 函数库四、数组的存储和加载

scipy

scipy 使用指南一、 常数和特殊函数二、 拟合与优化三、线性代数四、 统计五、数值积分六、 稀疏矩阵

matplotlib

matplotlib 使用指南一、matplotlib配置二、 matplotlib Artist三、基本概念四、布局五、 Path六、 path effect七、坐标变换八、 3D 绘图九、技巧

pandas

pandas 使用指南一、基本数据结构二、 内部数据结构三、 下标存取四、 运算五、变换六、数据清洗七、 字符串操作八、 聚合与分组九、时间序列十、 DataFrame 绘图十一、 移动窗口函数十二、 数据加载和保存

完整版看手册地址:

网页链接

部分章节节选:

市面上很多人工智能相关的书籍。大部分的书,面向小白,内容深度不够;小部分教材书或者科研书,内容艰深,又过于复杂。那么有没有,面向算法工程师(程序员)人群的,面向有一定数学基础、算法基础,能够快速上手写代码的人群的人工智能手册呢?有的!而且免费开源,非常有程序员范!《AI算法工程师手册》你值得拥有!

作者简介:

华校专,清华航天学院工程力学本科,国防科大 计算机专业硕士。清华四年每年成绩都是本系头名,曾任 阿里巴巴资深算法工程师,现任智易科技首席算法研究员,《Python 大战机器学习》的作者。

本文授权转载自公众号:专知

寒冬里,这个最酷AI创新平台招人啦!新智元邀你2020勇闯AI之巅

在新智元你可以获得:

与国内外一线大咖、行业翘楚面对面交流的机会掌握深耕人工智能领域,成为行业专家远高于同行业的底薪五险一金+月度奖金+项目奖励+年底双薪舒适的办公环境(北京融科资讯中心B座)一日三餐、水果零食

新智元邀你2020勇闯AI之巅,岗位信息详见海报:

全部讨论

随机漫步LastDance
2023-09-07 00:40

2019年,谁会想到今年AI这么火热?

初入门
2019-12-02 14:27

mark

深圳坪山网站建设公司网站推广优化联系电话网站优化推广怎么寻找客户上虞网站优化赚得到钱吗临淄网站优化多少钱福州网站优化服务网站推广优化外包哪家强网站文章搜索结果优化技巧有哪些优化网站为什么这么重要福田分类网站优化经验天门外包网站优化机械行业网站优化怎么去做静安区网站关键词排名优化开封网站优化哪家便宜东莞资深的免费网站优化香洲网站优化临海宁波网站优化本田思域车机优化大师网站哪里做网站优化批发赞皇县网站优化排名城厢区网站seo优化排名南通网站内容优化网站建设推广方案优化服务重庆岑溪网站关键词排名优化恩施网站权重优化电影网站怎么优化运营网站seo如何优化知乎如何优化网站傥佑云速捷质优如何体现网站优化网站推广优化选_复仇者下拉黄石市网站关键词优化哪家好香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化