推荐
专栏
教程
课程
飞鹅
本次共找到10000条
大数据
相关的信息
Stella981
•
4年前
SparkSQL的3种Join实现
引言Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。对于Spark来说有3中Join的实现,每种Join对应着不同的应用场景:BroadcastHashJoin:适合一张较小的表和一张大表进行joinShuffleHash
Wesley13
•
4年前
Mongo权威指南(初级篇)
MongoDB学习笔记特点:空间换时间易于扩展全文索引SQL与NoSQL的合并,解决了SQL的效率既有SQL的形式,又有NoSQL的自由分片(Sharding)将大的集合分割到不同的服务器(集群),MongoDB自动完成数据的分配,而且对应用层透明集群mongos是用户与集群的交互点,用户可以把一个集群当成一台服务器
Stella981
•
4年前
Memcache工作原理
Memcache是什么Memcache是danga.com的一个项目,最早是为LiveJournal服务的,目前全世界不少人使用这个缓存项目来构建自己大负载的网站,来分担数据库的压力。它可以应对任意多个连接,使用非阻塞的网络IO。由于它的工作机制是在内存中开辟一块空间,然后建立一个HashTable,Memcached自管理这些Ha
Stella981
•
4年前
Linux系统zip压缩命令
!(https://lxlinux.superbed.verylink.top/item/5fcee98b3ffa7d37b37c523b.jpg)不管是在Windows系统还是Linux系统中,我们常常会有一些大文件,特别占磁盘空间,对于这种占用空间大的文件我们很多时候就要用到ZIP(压缩文件格式),ZIP文件格式是一种数据压缩和文档储
Wesley13
•
4年前
API 资源隔离系统设计与实现
_(马蜂窝技术原创内容,公众号ID:mfwtech)_Part1背景大交通业务需要对接机票、火车票、租车、接送机等业务的外部供应链,供应商的数据接口大部分通过HTTP、HTTPS等协议进行通信。为了保证开发进度并支持集成测试时进行多场景支持,我们往往需要对供应商接口进行MOCK。之前我们在开发环境和
万界星空科技
•
7个月前
MES与ERP深度融合:数据报表、可视化大屏及系统集成技术详解
万界星空科技全新推出的:新一代AI低代码智能化MES系统,深度融合AI大数据技术,实现生产全流程可视化、智能排产、实时质量追溯与设备互联,助力企业降本增效30%。
Python进阶者
•
3年前
请教个问题,我想把数据中名字的重复值删掉,只保留年纪大的怎么整呢?
大家好,我是皮皮。一、前言国庆期间在Python白银交流群【谢峰】问了一个Pandas处理的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload_images/2623978
AGIC.TWang
•
1年前
试验大模型的图像识别能力
大模型的多模态能力是研究热点,图像识别作为其中重要组成部分,应用价值日益凸显。本文选取国内几家具有代表性的大模型厂商,对其图像识别能力进行试验观察,旨在比较分析各厂商模型的性能差异,为用户选择合适的图像识别模型提供参考。
幂简集成
•
9个月前
无需API接入!5大国产AI大模型文本生成能力实测对比(附试用入口)
本报告以小红书风格文案为例,针对5款国产顶流AI大模型(Deepseek,通义千问,KimiGPT等),通过API试用工具进行横向评测。首创对比方式:无需API接入!单条指令同步触发5大模型API,确保测试条件完全一致。重点考察:风格匹配度、核心性能指标、
幂简集成
•
8个月前
无需API接入!5大国产AI大模型API文本生成能力实测对比(附试用入口)
本报告以小红书风格文案为例,针对5款国产顶流AI大模型(Deepseek,通义千问,KimiGPT等),通过API试用工具进行横向评测。首创对比方式:无需API接入!单条指令同步触发5大模型API,确保测试条件完全一致。重点考察:风格匹配度、核心性能指标、
1
•••
41
42
43
•••
1000