`

关于项目发布宕机所想

 
阅读更多
    对于互联网创业团队来说,初期的公司规模小,业务量不大,人员不齐,网站部署发布不规范偶尔导致网站宕机的错误成本没有太大体现。
    当业务量上来后,不管是用户体验还是企业信任角度来说,人为可消除的宕机事故就非常严重了。
    对于此次事故,首先要摆正自己的认知态度,部署是自己成果的对外交付,可以说是最神圣的事情。需要做到对自己负责,对工作负责,对公司负责。其次做事就要有做事的样子,要足够专业,要求自己更专业的去做事。
    对于一个成熟产品来说,功能的升级固然是重要的,但是确保系统运行稳定,性能可靠是更重要的事情。
    由于目前还做不到完全自动化部署,在此分享一下当前的部署方案,还有提出一些防范措施。
    1.跳板机的使用
        发布操作,使用跳板机安全管理,权限管理。
    2.流量切分平滑部署
       举例2台服务器:部署1号机器,先将全部流量切到2号机器,部署完1号机器,再平分流量到1/2号。部署2号机器,将全部流量切到切到1号机器,部署完2号机器,再平分流量到1/2号。
       每台机器部署完要确保机器服务进程正常,服务日志正常,页面访问正常。
    3.窗口期
        对于核心系统,设立发布窗口期,比如每月15号。
    4.挂维护
        对于耗时较长的发布,需要在系统影响最低的时间发布,并挂维护页面通告。
     5.规范化
        没有上过测试的代码,不能发布。
        系统忙时尽量不发布。
        发布时,所有代码相关人员在场等发布完。
        发布时严格按照发布流程发布,并做到:发布-检查-确认。
        发布责任人轮值制度
0
0
分享到:
评论

相关推荐

    java开发一种高吞吐量的分布式发布订阅消息系统项目源码.zip

    2. **持久化**:Kafka将消息持久化到磁盘,即使在服务器宕机后,也能保证消息不丢失。 3. **分区与复制**:通过分区和副本策略,Kafka提供了容错能力,即使部分节点故障,系统仍能继续运行。 4. **流处理**:Kafka...

    2011年上半年系统集成项目管理工程师试卷及答案(上午下午题完整版

    考试中提到的邮件服务器经常宕机的问题,应启动问题管理流程来彻底解决。问题管理的主要目标是解决导致服务水平下降的根本原因,以避免问题的再次发生。 物联网是目前一个热门的概念,它描述了通过互联网将各种具有...

    IT项目运维资料-7.5 应急手册.docx

    - 针对特定的紧急情况(如服务器宕机、网络中断等),提供了详细的应对措施,包括重启流程、停止服务的操作指南等。 #### 八、相关人员联系表 **联系表:** - 列出了所有关键人员的信息,包括但不限于技术支持人员...

    订阅发布模式

    - **可靠性**:确保消息的可靠传递,即使在网络故障或代理服务宕机的情况下,也能尽可能减少消息丢失。 - **安全性**:可能涉及了身份验证、授权和加密,以保护消息的安全性。 - **订阅过滤**:订阅者可能只对特定...

    开源项目-nats-io-gnatsd.zip

    同时,NATS有内置的故障转移机制,当主服务器宕机时,其他服务器可以接管其角色。 5. **安全性**:NATS服务器可以通过TLS加密连接,确保通信安全。此外,还可以通过认证机制控制客户端的访问权限,如使用用户名/...

    c#使用windows服务更新站点地图的详细示例

    由于公司平台访问人数逐渐增多,公司项目的数据库已经几次出现宕机现象。为减轻数据库压力,我上个月对公司项目做了下调整。把新闻板块提取出来单独一个站点,单独一个数据库。减少了主站点和数据库的负担和压力。 ...

    201809网络爬虫系统-项目建设方案

    - **提高系统稳定性**:平均宕机运行时间不超过10小时/月,平均故障恢复时间不超过180分钟/次。 - **增强系统灵活性**:系统能够自动根据爬虫节点的负载情况进行负载均衡,同时具备故障自恢复能力。 ##### 1.3 应用...

    基 于 Java 轻 量 级 的 Mysql (Mariadb) Binlog 客 户 端

    宕机续读, 避免宕机期间造成数据丢失, 保证数据一致性。支持 传统项目 与 Spring Boot 项目集成, 同时兼容 Spring Boot 2.x 与 3.x 版本。数据转换, 基于 IBinlogEventHandler 的泛型参数, 提供自动的数据转换

    高校中央空调招标文件.doc

    - 宕机系统调测:针对宕机原因进行系统调测。 综上,本次招标文件详细规定了中央空调和网络主控机房精密空调的维护保养标准,旨在确保设备的稳定运行,提高能源效率,并为用户提供及时的技术支持和故障解决方案。...

    行政培训考核系统项目概要设计说明书.docx

    - **系统异常**: 如服务器宕机、数据库连接失败等。 - **错误**: 用户输入错误或程序逻辑错误。 - **系统出错**: 系统级的故障。 **4.2 出错信息** - 系统在检测到错误时,会向用户展示相应的错误提示信息,并记录...

    kafka生产数据工程

    5. **错误处理**:在生产环境中,我们需要处理网络故障、服务器宕机等问题。Java生产者提供了重试机制和回调函数,可以捕获发送失败的情况,并根据业务需求决定是否重新发送。 6. **配置优化**:为了获得最佳性能,...

    网上邮政项目需求分析说明书.pdf

    - **系统稳定性**:确保服务的高可用性,减少系统宕机时间和数据丢失。 - **处理速度**:系统需能快速处理大量邮件的发送、接收和检索请求。 - **容量规划**:为每个用户提供足够的存储空间,满足长期邮件存储...

    Dubbo面试专题1

    - 如果所有 ZooKeeper 都宕机,服务提供者和消费者之间的通信不会立即中断,但无法获取新服务的信息。服务提供者无状态,单个或全部宕机仅影响可用服务数量。 2. **Dubbo 的服务负载均衡策略**: - **Random Load...

    田杰.简历1

    他在项目中实施了TDD和持续集成,确保了无宕机发布更新。他还展示了在React框架下构建应用程序的能力,利用Sass编写自定义样式,并使用Webpack和Babel进行打包和转译。此外,他还熟练地使用Koa.js、Cassandra、MySql...

    PyPI 官网下载 | pneuro-1.3.3.tar.gz

    4. **容错机制**:考虑到Zookeeper的特性,`pneuro`可能内置了错误处理和恢复策略,以应对网络故障、服务器宕机等问题。 5. **API和文档**:一个成熟的库应该提供清晰的API文档,指导开发者如何安装、配置和使用`...

    软件架构设计PPT学习教案.pptx

    1. **高可用性**:确保系统在任何时候都能提供服务,避免单点故障,减少宕机时间。 2. **灵活的可扩展性**:随着业务增长,架构应能轻松扩展,支持垂直和水平扩展,确保性能。 3. **多维度安全控制**:保护系统免受...

    深圳天虹商场电子商务平台

    3. 高可靠性:选择高性能的服务器和稳定的操作系统,确保系统的持续运行,减少宕机时间。 4. 安全性:保障交易过程的安全,保护用户数据,避免信息泄露或被恶意攻击。 5. 快速实现:快速部署和上线,以尽早发挥电子...

    springboot集成mqtt

    需要处理 MQTT 连接异常,如网络中断、服务器宕机等。可以监听 `ConnectionLostListener`,并在连接丢失时尝试重新连接。 9. **实际应用案例** Spring Boot 集成 MQTT 的常见应用场景包括远程监控系统、智能家居...

Global site tag (gtag.js) - Google Analytics