敏捷开发 敏捷开发
1年前
将代码集体所有权进行到底!
极限编程中有一个实践是代码集体所有权(CollectiveOwnership)。这个实践从字面意思理解起来很简单,就是大家共同拥有代码,都有权限浏览、修改代码。这个实践从表面看是一个技术问题,只不过是源代码管理系统的权限如何设置的问题。但从本质上来讲,这是
使用Scrapy进行网络爬取时的缓存策略与User-Agent管理
缓存策略的重要性缓存策略在网络爬虫中扮演着至关重要的角色。合理利用缓存可以显著减少对目标网站的请求次数,降低服务器负担,同时提高数据抓取的效率。Scrapy提供了多种缓存机制,包括HTTP缓存和Scrapy内置的缓存系统。HTTP缓存HTTP缓存是基于HT
天航星 天航星
1年前
Docker 安装字体文件
由于Docker容器的隔离性,与宿主机是独立的运行环境,如果需要用到宿主机的字体文件就需要进行安装。例如在导出PDF文件时,如果缺少字体文件,就会产生乱码(常表现为中文变成方框)。Docker字体文件的安装比较简单,因为Linux系统的字体文件一般都在/u
天航星 天航星
1年前
VSCode 控制台中文乱码(永久性解决)
在Windows上使用VSCode进行开发时,经常会遇到控制台中文乱码的情况,设置编码往往都无效或者不能永久性解决。归根到底,是因为Windows中文版系统cmd编码默认为GBK,而VSCode默认新建文件的编码为UTF8,所以会出现中文乱码情况。要想永久
如何优雅的处理异常
一、什么是异常Java语言按照错误严重性,从throwale根类衍生出Error和Exception两大派系。Error(错误):程序在执行过程中所遇到的硬件或操作系统的错误。错误对程序而言是致命的,将导致程序无法运行。常见的错误有内存溢出,jvm虚拟机自
数据存储“取经路”,HBlock轻松“渡”!
天翼云自主研发的业内首款存储资源盘活系统HBlock能够与底层基础设施完全解耦,同服务器上现网业务并存,将x86、ARM、龙芯等异构通用服务器中的存储资源统一管理,通过标准的iSCSI协议提供分布式块存储服务。
解密Elasticsearch:深入探究这款搜索和分析引擎
•开篇最近使用Elasticsearch实现画像系统,实现的dmp的数据中台能力。同时调研了竞品的架构选型。以及重温了redis原理等。特此做一次es的总结和回顾。网上没看到有人用Elasticsearch来完成画像的。我来做第一次尝试。背景说完,我们先思
主动写入流对@ResponseBody注解的影响
作者:京东零售柯贤铭问题回溯2023年Q2某日运营反馈一个问题,商品系统商家中心某批量工具模板无法下载,导致功能无法使用(因为模板是动态变化的)商家中心报错(JSON串):"code":1,"msg":"失败"负责的同事看到失败后立即与我展开讨论(因为不是
启动Tomcat时报错,提示80端口被占用怎么办?
本文分享自天翼云开发者社区《》,作者:wn本节操作以WindowsServer2019Datacenter操作系统的弹性云主机为例介绍排查80端口占用的操作步骤。可能原因提示80端口被占用,由提示可知,该端口可能是被其他程序占用,包括被木马病毒占用,可以按
数据堂 数据堂
8个月前
全双工分轨语音数据集:让AI实现无缝对话
全双工语音交互是一种允许设备在接收语音的同时并行处理和响应的技术。在传统半双工模式下,用户需要说完一句话后等待系统响应,交互效率低且体验不自然;而全双工交互支持边听边说、实时打断和无效语音拒识等。