如何做好运维工作

发布网友 发布时间:2022-04-19 20:15

我来回答

2个回答

懂视网 时间:2022-05-06 12:16

到现在做运维有三个月时间了,从不熟悉到熟悉,从什么都不清楚到清楚手里所有服务器状态,从什么都不会到运维十几台服务器,搭建监控平台,制定了完整的一套打包备份策略。部门的运维只有我一个人做,所以什么问题都由我处理,在累之外的好处就

到现在做运维有三个月时间了,从不熟悉到熟悉,从什么都不清楚到清楚手里所有服务器状态,从什么都不会到运维十几台服务器,搭建监控平台,制定了完整的一套打包备份策略。部门的运维只有我一个人做,所以什么问题都由我处理,在累之外的好处就是我能接触的多,能学的多,这对个人能力的提升是有帮助的。日子也过得比较闷,随便做点总结吧,算是对三个月里技术之外自我提升的证明。

1、工欲善其事,必先利其器。先对自己用的电脑配置一下,保证其能方便操作。

2、添加虚拟主机时Option使用“-index”,禁止列目录。

3、有新站需要上线时请衡量一下服务器承受能力后做安排。尤其注意不要在低内存的服务器上放过多站点,在低内存主机上也要留意mysql内存分配问题。

4、在多网卡主机上分配网站上线时尽量考虑网卡负载,平衡网卡流量。

5、网站程序目录权限设置为755。

6、FTP用户名使用“申请人姓名@网站域名”,便于管理。

7、转移数据库尽量使用导出为sql文件。如果数据库太大不方便导出导入操作,可以在关闭mysql服务之后复制数据库文件,但这种做法无法恢复数据库中innoDB类型的表。

8、在收藏夹中收藏所有phpmyadmin的地址,定期打开所有phpmyadmin,检查是否正常运行。

9、转移网站时留意目录属性,尤其是跨平台转移时。网站转移后先通过添加hosts来访问,没有问题后再改域名指向。

10、对服务器的任何操作请做备份,确认一切OK之后再做清理。对于删除操作不要擅做主张。

11、服务器不能通过ssh连接上时打开其power panel,若power panel不能控制,请联系主机提供商客服。

12、手机请7×24小时开机,收到短信报警先打开网站确认是否确实出问题。连接上服务器后检查进程,检查资源使用,养成每天检查服务器的习惯。

13、Linux系统出现任何问题都是配置问题。如果必要请勿重启服务器。发现问题查日志,修改对应配置之后重启该项服务。

14、对服务器的任何操作请勿影响同事正常工作。

15、经常检查日志,检查脚本,看是否有不完善之处。

16、没事多练练正则表达式,多看看命令行,有好处。

17、以下命令要滚瓜烂熟:find grep sed awk top ps netstat ifconfig xargs egrep crontab,但不仅限于此。

18、熟悉mysql的命令,在phpmyadmin无法打开时只能用mysql的命令。

19、发现网站被挂黑链时,不要做任何修改,通知相关同事暂停修改站点。检查日志分析入侵途径,尽量寻找入侵者信息。可以有以下几个获取信息的途径:通过服务器记录下的IP,检查IP的地理位置,检查黑链中的域名,包括IP和地理位置,以及它们的whois相关信息,其中有些会有注册人,如果链接中注册人都是同一个,那可以基本肯定就是这个人,通过一些途径解决这个问题。

20、被挂马时,保存马之后分析马的特性。修改其源文件,添加短信报警内容,放在原位,如果对方再连接可以得到报警。当然别忘了找一下系统漏洞,把漏洞补好。

21、胆大心细,要有耐心。

22、不要将带有用户名密码的文档发送给任何人。

23、有问题多查文档,或者Google之。

热心网友 时间:2022-05-06 09:24

一、运维方法
技术层面:

随着信息技术的发展以及企业业务的不断扩张,运维人员所面临的系统架构越发的复杂,关联度越发紧密。对运维人员的要求也会越来越高,打造个个都是高手,对业务系统了如指掌。

1、需要运维人员快速转变观念,学会通过主动运维的方式应对复杂多变的 IT 问题,保证业务系统的稳定。

2、更多的站在客户的层面思考问题,解决问题。

3、使用集成的运维平台,在业务系统没有感知的情况下实现了业务的变更、升级。

运维文档层面:

一个好的系统或者项目,必定有很多的文档进行支撑。

1、系统建设前期,一定要做好系统的需求文档、设计文档、实施文档。在系统建设中要依据前期的文档进行实施和设计,并生成系统相关的问题总结文档和更新实施文档。

2、系统建设完成后,要基于系统的业务能力和使用对象编写操作手册和运维手册等。

3、业务在交付一定要文档同行。否则系统上线后问题层出不穷,导致运维人员手忙脚乱,不知道从何下手处理,往往会让运维人员绕很多的弯路,错失良机。

4、文档归类保存:文档也分好多种,比如配置文档、实施文档、设计文档、系统规范性文档、项目管理文档等等。做到一式两份,运维部门一份,档案室一份。

5、要求运维人员一定要具备相应的文档编写能力和整理能力。同时一定要严格按照之前的文档进行实施,有问题要学会及时沟通,并把修正后的问题更新到文档中。

6、建立知识库:把运维过程中出现的问题及解决办法和思路,另外最重要的是运维事件的总结,记录在案。

运维流程层面:

1、建立运维流程。要求运维人员一定要基于一个既定的规则来干活。

2、通过流程确定事件责任。业务人员专注点与运维人员的专注点不同,责任也不同。

3、使用ITIL 了(即 IT 基础架构库(Information Technology Infrastructure Library,ITIL,信息技术基础架构库)。ITIL 为企业的 IT 服务管理实践提供了一个客观、严谨、可量化的标准和规范。

二、运维人员技术
正所谓工欲善其事,必先利其器。很多的企业都在强化以用户服务为中心,专业技术为驱动的理念,可见拥有过硬的技术是多么的重要。

1、运维人员必须掌握的技能:

运维对技术的要求是很高的,首先运维人员要对自己所负责的系统有较深的理解,全程参与系统的设计、实施与运维。一定要具备相关领域的技术积累,有较丰富的设计或者排错经验

同时运维人员具备以下软实力:如沟通能力、合作心态和文档编写能力。

2、运维人员一定要对现在的主流技术有一定的涉猎(云计算、边缘计算、大数据、AIOps、人工智能、深度学习等等),要与时俱进。

3、经常参与线上或者线下的相关讨论和交流学习。了解目前流行的 IT 技术,并学习它,思考如何将其用于企业的业务中,为企业创造价值,提升运维效率。所以具备主流技术的捕捉能力,也是运维人员的必修课之一。

三、运维现场监控层面
监控的目的就是防患于未然。通过监控,运维人员能够及时了解到企业网络的运行状态。

一旦出现安全隐患,可以及时预警或者是以其他方式通知运维人员,让运维监控人员有时间处理和解决,避免影响业务系统的正常使用,将一切问题的根源扼杀在摇篮当中。现在的监控工具可以在监控指标触发时,自动修复一些故障,但是它最多帮你做些简单的自动化任务,更高阶的自动化任务需要运维人员具备较深的脚本和系统知识。
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com