对象存储论文

多态苔藓
• 阅读 5276

Facebook

Haystack 是Facebook设计来存储其小文件(图片)的系统,系统设计思想为小文件合并为一个大文件来存储,减少文件个数以及访问文件时的io次数。

Beaver, Doug, et al. "Finding a Needle in Haystack: Facebook's Photo
Storage." OSDI. Vol. 10. 2010.

http://static.usenix.org/legacy/events/osdi10/tech/full_papers/Beaver.pdf

F4 是 Haystack 的替代者。

Muralidhar, Subramanian, et al. "f4: Facebook's warm BLOB storage
system." 11th USENIX Symposium on Operating Systems Design and
Implementation (OSDI 14). 2014.

https://www.usenix.org/system/files/conference/osdi14/osdi14-paper-muralidhar.pdf

Windows Azure Storage

Windows Azure Storage 使用一套架构的基础上,同时提供了 queue, blob, table 服务,架构精巧,值的学习。WAS 也发表了一些相关论文,介绍了整个架构。另外,WAS还单独发表了一篇论文介绍其对 Erasure Coding 的实践。

Calder, Brad, et al. "Windows Azure Storage: a highly available cloud
storage service with strong consistency." Proceedings of the
Twenty-Third ACM Symposium on Operating Systems Principles. ACM, 2011.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.231.6486&rep=rep1&type=pdf#page=153

Huang, Cheng, et al. "Erasure coding in windows azure storage."
Presented as part of the 2012 USENIX Annual Technical Conference
(USENIX ATC 12). 2012.

https://www.usenix.org/system/files/conference/atc12/atc12-final181_0.pdf

LinkedIn Ambry

LinkedIn 开源了它的对象存储系统 ambry,并且在 SIGMOD2016 上发表了论文,详细介绍了整个系统的架构实现。

Noghabi, Shadi A., et al. "Ambry: LinkedIn’s Scalable Geo-Distributed
Object Store."

http://dprg.cs.uiuc.edu/docs/SIGMOD2016-a/ambry.pdf

Ozone: The object store on HDFS

Ozone 的 jira issue,可以看到开发进度与文档

https://issues.apache.org/jira/browse/HDFS-7240

hortonworks 对其的介绍

http://zh.hortonworks.com/blog/ozone-object-store-hdfs/

Ceph

Weil, Sage A., et al. "Ceph: A scalable, high-performance distributed
file system." Proceedings of the 7th symposium on Operating systems
design and implementation. USENIX Association, 2006.

http://www3.nd.edu/~dthain/courses/cse40771/spring2007/psnowber-ceph.pdf

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
4年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Wesley13 Wesley13
4年前
FLV文件格式
1.        FLV文件对齐方式FLV文件以大端对齐方式存放多字节整型。如存放数字无符号16位的数字300(0x012C),那么在FLV文件中存放的顺序是:|0x01|0x2C|。如果是无符号32位数字300(0x0000012C),那么在FLV文件中的存放顺序是:|0x00|0x00|0x00|0x01|0x2C。2.  
Stella981 Stella981
4年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Easter79 Easter79
4年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
4年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Easter79 Easter79
4年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Wesley13 Wesley13
4年前
Java日期时间API系列36
  十二时辰,古代劳动人民把一昼夜划分成十二个时段,每一个时段叫一个时辰。二十四小时和十二时辰对照表:时辰时间24时制子时深夜11:00凌晨01:0023:0001:00丑时上午01:00上午03:0001:0003:00寅时上午03:00上午0
Python进阶者 Python进阶者
2年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这