风花雪月 风花雪月
4年前
报错'gb2312' codec can't decode byte 0x9e in position 4100: illegal multibyte sequence,“gb2312”编解码器无法解码位置4100中的字节0x9e:非法的多字节序列
“gb2312”编解码器无法解码位置4100中的字节0x9e:非法的多字节序列。处理方式:withopen(path,encoding"utf8",errors'ignore')asf:使用errors'ignore'去掉(忽略)字符并返回不带字符的字符串。
Wesley13 Wesley13
4年前
mysql之数据分区
一:概述 通过把表分成多几区间,每个区间存储符合特定表达式的数据(即在我们创建分区表时指定每个分区存储的条件例如:PARTITIONp0VALUESLESSTHAN(100)即p0区间存储小于100的数据)。二:分区类型   即根据每个区间存储值的表达式不同,可分为如下几个类型,一般都是对数字类型或时间类型的数据进行分区。2.1 R
Wesley13 Wesley13
4年前
VoltDB 简介
简介过去几年来,出现了一种称为NoSQL的新型数据库管理系统。设计这些数据存储是为了克服在扩展传统关系数据库来处理一些应用程序时必须处理的数据负载类型的难题,比如说Amazon。这种可伸缩性的实现需要一定的代价:NoSQL系统通常不符合ACID(原子性、一致性、隔离和耐久性);它们最终一致地表明,只要给定一定量的时间,所有数据更新最终都会
Stella981 Stella981
4年前
MyBatis逆向代码生成器
     MyBatis是一个轻量级的 数据库映射框架,它的“动态sql”和“数据对象映射”机制,得到了你的青睐。但是在有时候,“数据表的字段多”、“字段的名称和model类的名称不匹配”、“mapperXML书写”让你比较困扰。为了解决这些问题,让你又更多时间投身到业务开发当中来。以下是本人开发的一个基于generatormaster的图形化
Stella981 Stella981
4年前
Hive优化的十大方法
Hive用的好,才能从数据中挖掘出更多的信息来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。Hive在极大数据或者数据不平衡等情况下,表现往往一般,因此也出现了presto、sparksql等替代品。这里重点讲解hive的优化方式,例如优化分组:sethive.auto.convert.join
Wesley13 Wesley13
4年前
DDD领域驱动设计实战(三)
        点击上方“JavaEdge”,关注公众号设为“星标”,第一时间纵览好文!1前言实体是领域模型中的领域对象。传统开发人员总将关注点放在数据,而非领域。因为在软件开发中,DB一直占据主导,因此首先考虑的是数据的属性(即数据库的列)和关联关系(外键关联),而非富有行为的领域概念
Wesley13 Wesley13
4年前
MySQL在并发场景下的优化手段
点击上方“Java架构沉思录”,选择“置顶公众号”。有内涵、有价值的文章第一时间送达!作者:李平来源:www.cnblogs.com/leefreeman/p/8286550.html1、背景对于数据库系统来说在多用户并发条件下提高并发性的同时又要保证数据的一致性一直是数据库系统追求的目标,既
Easter79 Easter79
4年前
TiDB优化
搭建了TiDB数据库集群。不过性能上没有达到我想要的秒级返回的结果。不过也能接收了,毕竟我们主要是用于olap,进行历史数据的分析。时间旧一点也是可以接受的。之前的历史数据是存放在oracle中的,由于历史数据很多,导致查询很慢,公司现在只能查询3个月前的订单(热数据),对于3个月后的订单,就不给客户查询了。我想到的一种解决办法就是分库分表,比如每一家门
糟糕,被SimpleDateFormat坑到啦!| 京东云技术团队
1\.问题背景问题的背景是这样的,在最近需求开发中遇到需要将给定目标数据通过某一固定的计量规则进行过滤并打标生成明细数据,其中发现存在一笔目标数据的时间在不符合现有日期规则的条件下,还是通过了规则引擎的匹配打标操作。故而需要对该错误匹配场景进行排查,定位其
糟糕,被SimpleDateFormat坑到啦!
1.问题背景问题的背景是这样的,在最近需求开发中遇到需要将给定目标数据通过某一固定的计量规则进行过滤并打标生成明细数据,其中发现存在一笔目标数据的时间在不符合现有日期规则的条件下,还是通过了规则引擎的匹配打标操作。故而需要对该错误匹配场景进行排查,定位其根