OceanBase 的长期主义
作为基础软件领域的三驾马车之一,数据库一直是技术开发中重要的领域,并延伸出诸多细分的类别:关系型数据库、非关系型数据库、分布式数据库、文档型数据库等等。国产数据库历经了几十年的发展,最近几年,迎来了快速发展的黄金时期。其中,OceanBase起源自2010年,最初主要用于支撑淘宝“双十一”活动爆炸式增长的海量数据,后来随着OceanBase不断地自研优化和增强,自此开启了发展的“狂飙”之路:从2010年用来扛住淘宝“双十一”峰值流量的分布式存储系统,到100%承载支付宝上所有核心交易的核心链路,再到2017年正式对外商用,与多家金融客户正式合作;从2019年TPC-C测试打破世界纪录,到2020年独立商业化,再到2021年的开源开放;从2016年支持分布式事务的1.0版本,到2022年成为业内首个单机分布式一体化数据库的4.0版本……终于,在今天迎来了2023年OceanBase的首次开发者大会。3月25日,OceanBase开发者大会·2023在北京举办,与开发者共同探讨单机分布式、云原生、HTAP等数据库前沿趋势,分享全新的产品RoadMap、交流场景探索和最佳实践,现场更有互动展区等开发者专属环节。同时,作为完全自研的国产开源数据库,OceanBase的议程内容干货满满,设置了“场景与最佳实践专场”、“开源生态专场”、“数据管理与服务专场”,以及可以动手体验的workshop供开发者学习和参与。值得一提的是,OceanBase 开源技术全景生态在大会上首次亮相,重磅推出的OceanBase 4.1版本增加了旁路导入、租户级别物理备库、MySQL 8.0兼容等多项开发者利好的能力,小规格环境TP性能sysnbench综合读写能力相比4.0提升40%,TPC-H 100G场景性能比4.0提升17%,TPC-DS 100G场景性能比4.0提升15%。不仅揭晓其从0到1的全面进展,还带来了180个生态工具与开发者见面,全面赋能开发者,是一场为开发者准备的数据库技术盛会。因此,CSDN特别专访了OceanBase CTO 杨传辉、OceanBase首席架构师杨志丰,作为数据库领域钻研多年的老兵和实践者,听听OceanBase对数据库发展与开发者生态的最新理解。
对开发者友好的 OceanBase
离不开四大重要方向
首先想问下正在看文章的你,作为开发者,你最喜欢什么样的数据库?你的回答可能是“既要又要还要”:数据库要功能强大、又要简单好用、还有可扩展性、当然最重要的稳定性,最好还得要兼容性……如何满足这些诉求?OceanBase正在打造对开发者友好的数据库。自2021年6月正式开源以来,在不到两年的时间里,OceanBase社区用户超33000名,截至发稿,收获全球超过5300位开发者关注,有199位代码贡献者进行代码贡献,追上了国外主流社区顶级项目数年的社区活跃度。为什么 OceanBase深受开发者青睐?在CSDN看来,OceanBase已具备大家“既要又要还要”的一些特性:一是稳定可靠。很多开发者有过凌晨爬起来处理过故障的经历,因此稳定可靠是数据库对开发者友好的首要条件。目前,OceanBase已连续10年稳定支撑双11,杨传辉说“OceanBase 从来没有出现过一次重大的生产故障。”为什么OceanBase这么牛?离不开这三大稳定秘诀:支付宝业务将数据库分成状态库和流水库;保持数据一致性,做到“应校尽校”,即不管针对多个父本之间的数据一致性,还是每次事故的并发操作或读写磁盘都做校验;通过混沌工程来保证稳定性,断网演练或直接拔网线,并持续备份恢复,OceanBase可以做到备份恢复成功率100%。二是高性能、低门槛。去年8月,OceanBase 4.0版本推出单机分布式一体化架构,打破了分布式技术的不可能,既可以像单机数据库一样使用,又拥有分布式数据库无限水平扩展的能力,更兼具高性能。同等硬件条件下,单机分布式一体架构的性能通过评测,超越了MySQL 8.0。单机分布式一体化架构大幅度降低开发者的使用门槛,OceanBase单机部署最小支持4核8G,目前 OceanBase可运行在世界最小的电脑树莓派开发板上。而且,单机部署同样具备分布式数据库所具备的完整功能。三是功能强大。OceanBase攻坚HTAP能力,让一份数据既能做交易又能做分析,实现低延时、低成本。四是符合技术趋势发展。OceanBase不仅是云原生,还是多云原生,能部署在多云平台,对用户提供完全一致的使用体验。除了以上这些,作为开发者最关心的性价比,OceanBase也十分友好:在同等性能的前提下,相比云上MySQL 8.0,OceanBase 可帮助用户降低18.57% 至42.05%的整体成本。例如,菲律宾版支付宝GCash,原来使用的是 MySQL,成本高,管理复杂。迁移到OceanBase HTAP分布式数据库后,整合所有MySQL到一套系统里面集中化管理,整体资源成本下降40%,存储空间下降70%。杨传辉在大会现场说,“OceanBase将持续降低开发者使用门槛,全面提升OceanBase的易用性,打造真正对开发者友好的数据库,建设开放的技术生态,让国产数据库走向田间地头。”不仅如此,OceanBase作为一款对开发者友好的数据库,不断倾听用户需求,持续保持迭代创新,本次在大会上推出的OceanBase 4.1便是最好的例子。OceanBase 4.1为开发者的研发与DBA痛点而生在分布式数据库面世之前,传统单机数据库是业界主流选择,但随着技术与应用场景的发展和诉求,传统单机数据库面临着高可用问题、数据一致性问题、容量/性能扩展和结构变更问题、HTAP问题和容灾能力不足等问题,成了开发者们难以言喻的“痛”。2022年,OceanBase发布的OceanBase 4.0,在分布式数据库的基础上引入了一体化结构创新理念,让分布式数据库也支持单机场景,并且保持性能和兼容性,打破了分布式数据库智能支持大企业、大体量数据的思维定式,规模化地支持大中小企业对数据库各种需求,同时还能很好地适配在云环境中,大大扩展了分布式数据库的场景和可能性。而在2023年OceanBase开发者大会上,OceanBase 4.1版本正式发布,这是一个基于OceanBase 4.0架构的延伸和增强。4.1版本在4.0版本的基础上大幅提升性能,从开发者的角度出发设计了一系列提升性能和效率的能力。因为4.0版本的全新架构固然为企业使用数据库带来更广阔的可能性,但在新的架构变化下,也增加了开发者们各种功能和适配上的工作。例如:场景性能持续提升通常,数据库读写是系统的主要瓶颈,也是优化收益最高的部分。OceanBase 4.1版本解决了开发者最关心的综合读写能力,在写入性能、查询优化、索引优化、存储/配置优化等等全方位的性能提升,增强优化了事务处理性能与复杂分析场景的性能持续能力;同时AP能力也得到了增强,优化了资源隔离能力,对存储层I/O多租户间的强隔离和快速导入。轻量化部署,门槛更低OceanBase 4.1在保持性能和稳定性以外,也大大降低了开发者使用分布式数据库的门槛,以及中小企业部署OceanBase的难度。过去提起分布式数据库,许多开发者第一反应就是“重”,而OceanBase 4.1版本只需要2分钟便可以快速安装部署;在主备库方面达到更细粒度、更灵活的租户级备库能力;还有白屏化部署分布式集群、OCP Express最小资源管理进行集群监控管理,以及可支持复杂场景下的全链路追踪诊断能力,从应用追踪到数据库内部的增强,大大减低了部署难度,部署更轻松。开发者易用性更强基于OceanBase 4.1单机分布式一体化架构,DDL功能(Data Definition Language,数据库模式定义语言DDL)也得到了多方位的增强,尤其是对MySQL 8.0功能性的兼容,新增了几十个系统函数和各种模式下的行为的兼容,使OceanBase 4.1易用性更强。OceanBase在提高易用性方面做了许多努力。比如DBA的易用性上主要增强了诊断能力,让应用于生产的数据库能够及时观察和诊断到产品的组件化和内部问题,在研发时特意长时间运行SQL观测实施进度;同时,“全链路追踪”的特性是OceanBase的一大亮点,普通数据库只能追踪到数据库内部,但OceanBase全链路追踪可以从应用开始一直追踪到数据库内部,更重要的是,OceanBase 4.1将所有组件全部打通,包括OceanBase各种语言的驱动、所有中间代理层和数据库内部协议、追踪的信息传递等等,为此,OceanBase 4.1特意修改了OceanBase 的通讯协议,让开发者在使用时更简单高效。将整体研发流程迁移至外部,统一企业版和社区版代码分支,让每一位开发者都可以看到代码进展。另外,OceanBase还将开源三大开发者工具ODC、OCP Express和MySQL binlog service,持续保持开源开放,汇聚更多开发者。用产品思维与开发者共建主流数据库的技术生态除了产品的易用性以外,数据库的发展离不开开发者们的共建,在杨传辉看来,为了更好地提高开发者的体验,OceanBase用产品思维去看待开发生态的运营,在场景化、开发者运营以及社区方面重点运营,汲取更多开发者提出的建议和意见,共同构建一个更符合本土化开发习惯、更低门槛、更可持续发展的开源数据库。比如在开发者文档体验方面,OceanBase结合外界反馈的问题和建议,从贴近用户视角和场景做设计,重构了7000多页文档。不仅帮助开发者快速找到对应文档,在文档中还清楚告知其能够“解决什么问题”而不是仅仅展示“我是干什么的”,以及面向开发者的研发流程重构,确保每一位开发者的可参与性,这是一个解决方案整体思路上的变化,帮助开发者将精力用于开发、创造上,而非繁琐重复的基础工作上;而且近两年OceanBase也不断在降低开发者的入门门槛,比如诊断能力、文档、工具等方面的优化,以及开发者的设备限制如何解决等等。另外在社区方面,OceanBase从去年开始不断打造更多元的社区活动,除了线上的各种齐备的教程以外,还围绕产品的用法、玩法和技术解析,以线上视频、线下Meetup等方式与开发者近距离沟通。今年还准备了许多城市级的Meetup,比如到成都、武汉等城市,与企业联合,让开发者们跟随OceanBase走进企业实地观测应用场景;在激励政策方面,除了对优质社区成员的评选以外,还有不定期的线下聚会、技术交流等玩法,目的就是为了更进一步与开发者沟通、共建社区。在人才培养上,通过举办OceanBase 数据库大赛等活动,推动产学研协同育人的联合教学。未来展望未来,OceanBase 将走向何方?杨传辉表示,从OceanBase 4.1开始,OceanBase将持续拓展OceanBase数据库的分析能力,朝着一体化的思路继续前进,同时加强云上能力,包括对多云更好的支持、云上不同硬件环境下发挥更高性价比、降低开发者使用的复杂度、与云上和线下的更多生态工具做对接和适配,包括应用代码、数据治理、运维管控、K8s能力的进一步提升等方面持续发力。重点在于,所有发展都需要配合生态来做。OceanBase希望给生态留下足够的空间,有计划地去与业内优质生态伙伴合作与适配,让更多的伙伴和开发者参与到OceanBase当中,共同构建和治理国产主流数据库,为国产数据库的繁荣生态贡献力量。实时数据分析与专业的数据仓库到底未来发展如何,杨传辉认为,未来HTAP和OLAP将会并行和共存, HTAP是OLAP的延伸和“Plus”版。就像OceanBase在做高并发的OLAP基础上也能做单机分布式一体化,并保证性能与稳定性,在此基础上还能顺带把实时分析的场景解决掉。另外从场景的角度看,对于大企业来说,很多时候要做全公司的数据治理,所以数仓本身即使脱离了数据库的范畴,也依旧有自己独特的价值,而HTAP数据库更适合中小企业应用,因为不需要解决太大的数据治理问题,可以降低成本。我们看到,在多年发展之后,现在的OceanBase变化确实很多,但其中不变的是OceanBase将坚定HTAP的方向,坚持“一个系统,一份 schema”,在此基础上提高隔离性和列存支持,同时,消除系统的复杂性也是 HTAP 走向开发者的重要前提。具体产品技术角度,不变的是OceanBase坚持自研和落地核心业务场景,以及云上云下一致的体验,变的是从上云到多云部署的云友好和更好的性价比;不变的是核心技术完全开源,变的是更开放的协作模式和更好的易用性。杨传辉表示,希望真正将OceanBase做成一款主流的、比肩海外主流数据库的产品,就要坚持的长期主义,这就不仅是产品的高并发与性能稳定性满足需求,更要做到让开发者喜欢用、易用,也许这就是OceanBase一路发展历程的原因和核心动力。CSDN将持续报道国产数据库技术发展,见证优秀的数据库崛起。也欢迎开发者关注OceanBase开发者大会,一起投身国产软件的开发与建设。
随便看看:
相关推荐:
网友评论:
推荐使用友言、多说、畅言(需备案后使用)等社会化评论插件