Karen110 Karen110
2年前
人工智能数学基础-线性代数2:向量的点积、內积、数量积和外积
一、内积1.1、定义内积(innerproduct)又称数量积(scalarproduct)、点积(dotproduct),是指接受在实数R上的两个向量并返回一个实数值标量的二元运算。两个向量a\a1,a2,…,an\和b\b1,b2,…,bn\的点积定义为:a·ba1b1a2b2……an\bn。使用矩阵乘法并把(
【NLP系列】Bert词向量的空间分布
我们知道Bert预训练模型针对分词、ner、文本分类等下游任务取得了很好的效果,但在语义相似度任务上,表现相较于Word2Vec、Glove等并没有明显的提升
Stella981 Stella981
2年前
HashMap 的 defaultLoadFactor 的一种推导计算思路
1\.为啥需要defaultLoadFactor现在主流的HashMap,一般的实现思路都是开放地址法链地址法的方式来实现。!image(https://zhxhashblog.osscnbeijing.aliyuncs.com/Project%20Reactor/HashMap/
Wesley13 Wesley13
2年前
15.链地址法
同样是为了解决哈希表中索引重复问题的算法,基本思路为将哈希表中维护的数组改成存储链表的数组,将数据存在链表中。也可以用数组但是数组的插入和删除的效率较低,故采用链表。实现:链表的实现:/链结点,相当于是车厢/publicclassNode{//数据域publi
Stella981 Stella981
2年前
Linux Mint 17 下安装搜狗拼音输入法
LinuxMint不像Ubuntu那样默认配置了中文输入法,需要我们自己安装,下面给出安装方法及输入法所需依赖:1.sudoaddaptrepositoryppa:fcitxteam/nightly2.sudoaptgetupdate3.sudoaptgetinstallf
Stella981 Stella981
2年前
Panda处理文本和时序数据?首选向量化
导读Pandas作为Python数据分析的首选框架,不仅功能强大接口丰富,而且执行效率也相比原生Python要快的多,这是得益于Pandas底层由C实现,同时其向量化执行方式也非常利于并行计算。更重要的是,这种向量化操作不仅适用于数值计算,对于文本和时间格式也有着良好的支持,而这就不得不从Pandas的属性接口谈起。腾讯课堂|
Stella981 Stella981
2年前
Python Numpy 向量、矩阵的常用创建方法
1\.numpy.array()该方法可以直接定义一个向量或矩阵测试代码importnumpyasnpvectornp.array(1,2,3,4)metrixnp.array(1,2,3,4,
Stella981 Stella981
2年前
Spark OneHotEncoder
1、概念独热编码(OneHotEncoding) 将表示为标签索引的分类特征映射到二进制向量,该向量最多具有一个单一的单值,该单值表示所有特征值集合中特定特征值的存在。此编码允许期望连续特征(例如逻辑回归)的算法使用分类特征。对于字符串类型的输入数据,通常首先使用StringIndexer
Stella981 Stella981
2年前
Python使用Faiss库实现向量近邻搜索
本文是Python应用于推荐系统领域的技术文章。Embedding的近邻搜索是当前图推荐系统非常重要的一种召回方式,通过item2vec、矩阵分解、双塔DNN等方式都能够产出训练好的userembedding、itemembedding,对于embedding的使用非常的灵活:输入userembedding,近邻搜索it
京东云开发者 京东云开发者
5个月前
测试用例设计方法六脉神剑——第三剑:倚天屠龙,正交试验冲锋 | 京东物流技术团队
1引言上篇讲了因果图和判定表法,而这两种方法在变量值很多、排列组合数量极大的场景下,会生成非常庞大且冗余的测试用例,此时我们很难对所有组合场景进行全量测试用例覆盖,基于此短板,正交试验法应运而生。2概念及原理2.1定义正交试验法是研究多因素、多水平的一种试