4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

Wesley13
• 阅读 1035

想成为NLP工程师,但是否因为没有实际项目经历而发愁?是否希望丰富简历中的项目经验,从而提高面试的通过率?是否想尝试有技术含量的项目,以后为进大厂而准备? 这就是我们实战训练营的初衷。

京东智联云联合贪心科技推出了《京东NLP****项目实战训练营》,让学员通过4个月完成4个非常具有挑战的京东落地应用项目,智能医疗分诊项目、智能营销文案生成项目、智能对话系统项目、同类商品搜索项目。完成这些项目的同时,你也会学会使用BERT, GCN, GAT等前沿技术原理和应用。

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

四大真实京东实战场景

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

京东NLP企业项目实战训练营3期

专注于培养行业TOP10%的NLP工程师

添加课程顾问小姐姐微信

报名、课程咨询

👇👇👇

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

01 课程大纲

第一章:京东健康智能分诊项目

Part 01:文本处理与特征工程

  • BagofWords模型

  • 从tf-idf到Word2Vec

  • SkipGram与CBOW

  • HierarhicalSoftmax与NegativeSampling

  • FastText

  • N-gram与平滑操作

  • 文本特征工程

  • 工具的使用:Gensim、Sklearn、jieba的使用

  • 论文:SkipGram论文解读&复现

  • 专题:如果阅读科研论文

  • 项目:京东健康智能分诊项目讲解(1)

Part 02:基于统计学习的分类方法

  • 决策树

  • CART模型

  • Bagging&Boosting

  • 随机森林和GBDT

  • XGBoost

  • 精确率、召回率

  • F1,AUC

  • 论文:XGBoost的Paper和代码解读

  • 实战:LightGBM的解读与实战

  • 专题:如何处理样本不平衡问题

  • 项目:京东健康智能分诊项目讲解(2)

Part 03:基于深度学习的分类方法

  • 统计学习与深度学习的区别

  • 深度学习与浅层学习

  • 从逻辑回归到神经网络

  • 深度学习的非线性性质

  • 损失函数与优化器

  • 神经网络的调参

  • 实战:Pytorch的基础使用

  • 实战:使用Pytorch实现神经网络和卷积神经网络

  • 专题:不同优化器比较:Momentum,AdaGrad,RMSProp,Adam

  • 项目:京东健康智能分诊项目讲解(3)

Part 04:CNN与工业界模型部署

  • CNN,TextCNN

  • 模型的部署

  • Docker的使用

  • Git&Jenkins的使用

  • Kubernetes的使用

  • Flask的使用

  • 实战:Neufoundry平台上的模型部署

  • 专题:智能分诊前沿技术讲解

  • 京东嘉宾:京东的文本分类部署

  • 京东嘉宾:京东的特征工程技术方案

第二章:京东智能营销文本生成项目

Part 05:递归神经网络RNN与BPTT算法

  • BPTT与RNN中的梯度消失、爆炸

  • 梯度爆炸的处理

  • LSTM与GRU

  • 基于LSTM的文本分类

  • Bi-LSTM与DeepBi-LSTM

  • RNN与LSTM的可视化

  • 实战:基于LSTM的情感分类

  • 实战:利用Pytorch实现多层LSTM

  • 实战:基于LSTM语言模型的文本生成

  • 专题:GPU技术详解

  • 项目:京东智能营销文本生成项目讲解(1)

Part 06:Seq2Seq模型与营销文本生成

  • Encoder-Decoder模型以及各类应用场景

  • Seq2Seq模型与注意力机制

  • GreedyDecoding

  • BeamSearch

  • 基于Seq2Seq的文本生成

  • 文本生成的评价指标

  • 实战:基于Seq2Seq的机器翻译

  • 论文:LSTM-CNNs论文

  • 项目:京东智能营销文本生成项目讲解(2)

Part 07:Pointer-GeneratorNetwork和多模态识别

  • 抽取式文本摘要和生成式文本摘要

  • Pointer-GeneratorNetwork

  • BeamSearch优化思路

  • LengthNormalization

  • CoverageNormalization

  • EndofSentenceNormalization

  • 多模态识别技术:ResNet和FasterRCNN

  • 实战:PGN+Seq2Seq解读

  • 论文:京东论文解读

  • 论文:FasterRCNN解读

  • 项目:京东智能营销文本生成项目讲解(3)

第三章:京东智能客服对话系统项目

Part 08:对话系统技术概览

  • 对话系统的分类方式

  • 检索方法和生成方法

  • 任务导向型系统和非任务导向型系统

  • 索引的建立

  • 对话系统中的召回

  • 对话系统中的排序

  • 倒排索引和WAND算法

  • 倒排索引的空间优化

  • 信息检索系统的评估方式

  • 实战:倒排索引的实现

  • 实战:VariableByteCompression的检索系统实现

  • 项目:京东智能对话系统项目讲解(1)

Part 09:检索系统中的召回

  • ApproximateNearestNeighborSearch

  • KD树

  • LSH技术

  • 近似图(ProximityGraph)

  • SmallWordGraph

  • NSW和HNSW

  • 论文:HNSW论文解读

  • 项目:京东智能对话系统项目讲解(2)

Part10:对话系统中的排序

  • LearningtoRank技术介绍

  • Point-wiseApproach

  • Pair-wiseApproach

  • List-wiseApproach

  • 常用模型的评估指标

  • MAP,NDCG

  • 相似度计算方法

  • WordMover'sDistance

  • 论文:WMD的实现

  • 项目:京东智能对话系统项目讲解(3)

Part11:自注意力机制以及Transformer

  • 从Attention到Self-Attention

  • Transformer的应用

  • Transformer模型详解

  • Transformer的实现

  • Reformer

  • Synthesizer

  • Low-RankBottleneck

  • 论文:TransformerXL论文解读

  • 项目:京东智能对话系统项目讲解(4)

  • 京东嘉宾:工业界的检索模型和L2R

Part12:基于BERT和Transformer的闲聊引擎

  • 闲聊引擎技术框架

  • 预训练模型简介

  • AE与VAE

  • BERT模型详解

  • BERT的不同训练方法

  • GPT2

  • GPT3

  • ALBERT

  • 实战:BERT的fine-tuning实战讲解

  • 论文:UniLM解读与复现

  • 论文:XLNet的解读与复现

  • 项目:京东智能对话系统项目讲解(5)

  • 京东嘉宾:工业界的生成式对话模型

第四章:京东同类商品搜索项目

Part13:基于图的学习

  • 图表示概论

  • 图与知识图谱

  • 基于图表示的应用场景

  • 关于图的一些特征

  • 关于图的一些常见算法

  • Deepwalk和Node2vec

  • TransE图嵌入模型

  • DSNE图嵌入模型

  • 实战:基于人工特征的链接预测实现

  • 实战:基于Node2Vec的链接预测实现

  • 项目:京东同类商品搜索项目讲解(1)

Part14:基于图神经网络的EntityLinking

  • 什么是实体

  • EntityLinking的简单解法

  • 基于图的EntityLink思路

  • 卷积神经网络回顾

  • 在图中的卷积

  • 图中的信息传递

  • 图卷积神经网络(GCN)

  • 基于GCN的EntityLinking

  • 论文:GCN论文解读和复现

  • 项目:京东同类商品搜索项目讲解(2)

Part15:GAT、GraphSage与EntityLinking

  • 注意力机制回顾

  • 注意力机制与图表示

  • GAT模型详解

  • GAT与GCN的比较

  • GraphSage详解

  • GAT与知识图谱应用

  • 对于Heterogenous数据处理

  • 论文:GAT论文解读与复现

  • 论文:GraphSage论文解读与复现

  • 项目:京东同类商品搜索项目讲解(3)

Part16:图神经网络与其他应用

  • NodeClassification

  • GraphClassification

  • LinkPrediction

  • CommunityDetection

  • 推荐系统

  • 文本分类

  • 图神经网络的未来发展

  • 论文:图神经网络综述

  • 项目:京东同类商品搜索项目讲解(4)

主讲老师

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

京东NLP企业项目实战训练营3期

专注于培养行业TOP10%的NLP工程师

添加课程顾问小姐姐微信

报名、课程咨询

👇👇👇

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

01 科学的实战安排

每一期的训练营都有严谨科学的安排,每周伴随着理论、实战、案例分享、项目讲解等课程一系列课程内容。

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

▲节选前两周部分课程安排,详细安排请跟咨询师询问

02 项目讲解&实战帮助

训练营最终的目的是帮助学员完成项目,理解项目中包含核心知识技能,训练营中会花大量的时间帮助学员理解项目以及所涉及到的实战讲解。每一个项目会配套详细的实验手册、工程手册、还有注解的项目代码,所有实战过程都在云端GPU上完成。

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

▲节选往期部分课程安排

03 最佳工程实战

来自京东智联云等业界专家来讲述工业界的最佳工程实战,如AI模型的部署、代码编写、模型的调参以及debug等技术。

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

▲源自京东智联云AI某模块架构图

04 专业的论文解读

作为AI工程师,阅读论文能力是必须要的。在课程里,我们每1-2周会安排一篇经典英文文章供学员阅读,之后由老师帮助解读。

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

▲节选往期部分论文安排

05 行业案例分享

训练营过程中会邀请合作的专家来分享行业案例以及技术解决方案,如知识图谱的搭建、保险领域的客服系统等。

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

▲专家分享

《Google YouTube 基于深度学习的视频推荐》

嘉宾简介:曾博士

计算机视觉,机器学习领域专家

先后在CVPR,ACMMM,TPAMI,SCI 期刊,EI 会议等发表超过30篇论文

06 日常社群答疑

为了帮助解决学员遇到的问题,专业助教会提供全天社群答疑服务。我们的助教均来来自于一线AI公司和国内外名校,扎实的理论和工业界应用也是我们选拔助教老师的重要标准,拒绝空谈理论。

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

▲社群内老师专业的解答

07 丰富的线下交流活动

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

▲参观京东总部,倾听大咖分享

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

报名须知

1、本课程为收费教学。

2、本期训练营招生名额有限

3、品质保障!正式开课后7天内****,无条件全额退款。

4、学习本课程需要具备一定的机器学习基础。

●●●

京东NLP企业项目实战训练营3期

专注于培养行业TOP10%的NLP工程师

添加课程顾问小姐姐微信

报名、课程咨询

👇👇👇

4个可以写进简历的京东NLP项目:医疗分诊、营销文案生成、商品图谱、对话系统

本文分享自微信公众号 - AI算法与图像处理(AI_study)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Easter79 Easter79
2年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
2年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Stella981 Stella981
2年前
AI 科学家带你快速 Get 人工智能最热技术
!(https://pic3.zhimg.com/80/v2af9f6637b50b09be60b00a42f3812d5e_1440w.jpg)日前,京东智联云与贪心学院联合举办的人工智能前沿技
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这