数据加速器 GooseFS 1.2.0 版本正式发布

大数据
• 阅读 975

腾讯云存储团队正式在官方网站上架数据加速器 GooseFS 产品,同时数据加速器 GooseFS 1.2.0 版本正式发布。该版本总结并收敛了 GooseFS 在过往大规模生产环境实践中遇到的性能、稳定性和安全问题,全面提升产品稳定性。

数据加速器 GooseFS 1.2.0 版本正式发布

重要更新点

1、透明加速热开关

透明加速热开关可以让大数据用户能够使用 CosN scheme 访问 GooseFS,该特性方便用户在不修改已有表定义的前提下,使用 GooseFS 的功能,提升业务访问性能。
透明加速热开关主要用于提升系统的可运维性。在生产环境中使用 GooseFS 集群进行访问加速时,可能出现集群节点故障等各种问题,当集群无法自愈,并且需要尽快恢复现网业务时,需要有手段可以将访问流量在分钟级迅速切换到底层存储服务,然后在不影响计算作业的前提下,运维和管理 GooseFS 集群。

在具体使用过程中,可以通过如下指令启停透明加速热开关:

goosefs.user.client.transparent_acceleration.enabled = true | false

其中, false 代表开启透明加速能力,开启后所有访问请求会优先经过 GooseFS; true 代表关闭透明加速能力,关闭后所有访问请求会直接透传到底层。

开启元数据缓存热开关能力需要先开启透明加速能力,有关透明加速能力文档介绍,可以参考文档

2、集成 CHDFS 认证和 Ranger 鉴权体系

Apache Ranger 是大数据生态系统中用于控制访问权限的一个标准鉴权组件,GooseFS 作为大数据和数据湖场景下的加速存储系统,也已经支持接入 Apache Ranger 的统一鉴权平台中;CHDFS 则是公有云原生的 HDFS 服务。

本期重点更新主要集成了 CHDFS 认证和 Ranger 鉴权体系,方便大数据业务尽可能提升业务安全管控能力。在具体使用过程中,可以通过配置文件很方便地将 CHDFS 认证和 Ranger 鉴权体系集成到 GooseFS 中。当部署好 GooseFS 后,在 goosefs-env.sh 中配置 hadoop-ranger-client-for-hadoop-${hadoop.version}-${version}.jar和 cosn-ranger-interface-${version}.jar 在的路径:

GOOSEFS_CLASSPATH=${GOOSEFS_HOME}/lib/goosefs-underfs-chdfs-${version}.jar:/path/to/cosn-ranger-interface-${version}.jar:/path/to/hadoop-ranger-client-for-hadoop-${hadoop.version}-${version}.jar

对于 EMR 的环境,可以查看 /usr/local/service/hadoop/share/hadoop/common/lib 这个路径是否存在上述两个依赖包,如果存在的话,将这两个包按照上述方法配置到 GooseFS 即可:

GOOSEFS_CLASSPATH=${GOOSEFS_HOME}/lib/goosefs-underfs-chdfs-${version}.jar:/usr/local/service/hadoop/share/hadoop/common/lib/cosn-ranger-interface-${version}.jar:/usr/local/service/hadoop/share/hadoop/common/lib/hadoop-ranger-client-for-hadoop-${hadoop.version}-${version}.jar

然后,确保在 core-site.xml 配置文件中,开启了 ranger 相关的配置选项:

 <property>
    <name>fs.ofs.ranger.enable.flag</name>
    <value>true</value>
  </property>

最后,在 goosefs-site.properties 中需要将 core-site.xml 的配置文件路径指定到 goosefs underfs hdfs 的配置路径中,同时开启 security authorization,这样才能保证身份认证信息能够通过 GooseFS 传递到 UFS 层:

goosefs.underfs.hdfs.configuration=/usr/local/service/hadoop/etc/hadoop/hdfs-site.xml:/usr/local/service/hadoop/etc/hadoop/core-site.xml
# Security properties
goosefs.security.authorization.permission.enabled=true
goosefs.security.authentication.type=SIMPLE

以上的配置至少需要同步到所有的 Master 节点上。然后重启 Master 即可开启 CHDFS 的鉴权。

数据加速器 GooseFS 1.2.0 版本正式发布

数据加速器 GooseFS 1.2.0 版本正式发布

数据加速器 GooseFS 1.2.0 版本正式发布

有关 GooseFS Ranger 的详细介绍,可请前往使用 Apache Ranger 控制 GooseFS 的访问权限进一步详细了解。

其他更新

除了上述更新之外,我们在本次版本中还优化了 GooseFS 依赖的组件:

  • 升级了 RocksDB 的依赖版本到6.15.2(从5.15.10 升级到6.15.2);
  • 更新了依赖的Linux/MacOS libjnifuse 的动态链接库;

同时,根据生产环境下大规模使用后的反馈,我们也修复如下问题:

  • 修复 Journal 乱序的问题;
  • Ratis 死锁导致的 GRPC 问题;
  • 修复了HDFSUnderFileSystemFactory 加载位置不正确的问题;
  • 修复了 log4j2 的安全漏洞问题;
  • 修复了ufsPath 前缀检查错误的问题;

如果您想了解数据加速器 GooseFS 的更多信息,或者上手使用 GooseFS ,请点前往官网文档

— END —

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
美凌格栋栋酱 美凌格栋栋酱
7个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
4年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
VBox 启动虚拟机失败
在Vbox(5.0.8版本)启动Ubuntu的虚拟机时,遇到错误信息:NtCreateFile(\\Device\\VBoxDrvStub)failed:0xc000000034STATUS\_OBJECT\_NAME\_NOT\_FOUND(0retries) (rc101)Makesurethekern
Stella981 Stella981
3年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Easter79 Easter79
3年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
大数据
大数据
Lv1
我堆的雪人说想见你,她等不了太久。
文章
4
粉丝
0
获赞
0