使用Subversion进行版本控制

2020年05月15日 阅读数:784
这篇文章主要向大家介绍使用Subversion进行版本控制,主要内容包括基础应用、实用技巧、原理机制等方面,希望对大家有所帮助。

目录git

译者序
前言
序言
读者
怎样阅读本书
本书约定
排版习惯
图标
本书组织结构
这本书是免费的
致谢
来自Ben Collins-Sussman
来自Brian W. Fitzpatrick
来自C. Michael Pilato
1. 介绍
Subversion是什么?
Subversion的历史
Subversion的特性
Subversion的架构
安装Subversion
Subversion的组件
快速入门
2. 基本概念
版本库
版本模型
文件共享的问题
锁定-修改-解锁 方案
拷贝-修改-合并 方案
Subversion实战
工做拷贝
修订版本
工做拷贝怎样追踪版本库
混合修订版本的工做拷贝
更新和提交是分开的
混合修订版本很是正常
混合修订版本颇有用
混合修订版本也有限制
摘要
3. 指导教程
帮助!
导入
修订版本: 号码、关键字和日期,噢,个人!
修订版本号
修订版本关键字
修订版本日期
初始化的Checkout
基本的工做周期
更新你的工做拷贝
修改你的工做拷贝
检查你的修改
svn status
svn diff
svn revert
解决冲突(合并别人的修改)
手工合并冲突
拷贝覆盖你的工做文件
下注:使用svn revert
提交你得修改
检验历史
svn log
svn diff
比较本地修改
比较工做拷贝和版本库
比较版本库与版本库
svn cat
svn list
关于历史的最后一个词
其余有用的命令
svn cleanup
svn import
摘要
4. 分支与合并
什么是分支?
使用分支
建立分支
在分支上工做
分支背后的关键概念
在分支间拷贝修改
拷贝特定的修改
合并背后的关键概念
合并的最佳实践
手工追踪合并
预览合并
合并冲突
关注仍是忽视祖先
常见用例
合并一条分支到另外一支
取消修改
找回删除的项目
经常使用分支模式
发布分支
特性分支
转换工做拷贝
标签
创建最简单的标签
创建复杂的标签
分支维护
版本库布局
数据的生命周期
摘要
5. 版本库管理
版本库基本知识
理解事务和修订版本
未受版本控制的属性
版本库数据存储
Berkeley DB
FSFS
版本库的建立和配置
钩子脚本
Berkeley DB配置
版本库维护
管理员的工具箱
svnlook
svnadmin
svndumpfilter
Berkeley DB工具
版本库清理
管理磁盘空间
版本库的恢复
版本库的移植
版本库备份
添加项目
选择一种版本库布局
建立布局,导入初始数据
摘要
6. 配置服务器
概述
网络模型
请求和响应
客户端凭证缓存
svnserve,一个自定义的服务器
调用服务器
内置的认证和受权
建立一个用户文件和域
设置访问控制
SSH认证和受权
SSH配置技巧
初始设置
控制调用的命令
httpd,Apache的HTTP服务器
必备条件
基本的Apache配置
认证选项
基本HTTP认证
SSL证书管理
受权选项
总体访问控制
每目录访问控制
关闭路径为基础的检查
额外的糖果
版本库浏览
其它特性
支持多种版本库访问方法
7. 高级主题
运行配置区
配置区布局
配置和Windows注册表
配置选项
服务器
config
属性
为何须要属性?
处理属性
特别属性
svn:executable
svn:mime-type
svn:ignore
svn:keywords
svn:eol-style
svn:externals
svn:special
svn:needs-lock
自动属性设置
锁定
建立锁定
发现锁定
解除和偷窃锁定
锁定交流
Peg和实施修订版本
外部定义
卖主分支
常规的卖主分支管理过程
svn_load_dirs.pl
本地化
理解地区
Subversion对地区的支持
使用外置区别工具
外置diff
外置diff3
Subversion版本库URL
8. 开发者信息
分层的库设计
版本库层
版本库访问层
RA-DAV(使用HTTP/DAV版本库访问)
RA-SVN(自定义协议版本库访问)
RA-Local(直接版本库访问)
你的RA库在这里
客户端层
使用API
Apache可移植运行库
URL和路径需求
使用C和C++之外的语言
进入工做拷贝的管理区
条目文件
原始拷贝和属性文件
WebDAV
使用内存池编程
为Subversion作贡献
加入社区
取得源代码
开始熟悉社区政策
做出修改并测试
贡献你的修改
9. Subversion彻底参考
Subversion命令行客户端:svn
svn选项
svn子命令
svn add
svn blame
svn cat
svn checkout
svn cleanup
svn commit
svn copy
svn delete
svn diff
svn export
svn help
svn import
svn info
svn list
svn lock
svn log
svn merge
svn mkdir
svn move
svn propdel
svn propedit
svn propget
svn proplist
svn propset
svn resolved
svn revert
svn status
svn switch
svn unlock
svn update
svnadmin
svnadmin Switches
svnadmin Subcommands
svnadmin create
svnadmin deltify
svnadmin dump
svnadmin help
svnadmin hotcopy
svnadmin list-dblogs
svnadmin list-unused-dblogs
svnadmin load
svnadmin lslocks
svnadmin lstxns
svnadmin recover
svnadmin rmlocks
svnadmin rmtxns
svnadmin setlog
svnadmin verify
svnlook
svnlook选项
svnlook
svnlook author
svnlook cat
svnlook changed
svnlook date
svnlook diff
svnlook dirs-changed
svnlook help
svnlook history
svnlook info
svnlook lock
svnlook log
svnlook propget
svnlook proplist
svnlook tree
svnlook uuid
svnlook youngest
svnserve
svnserve选项
svnversion
svnversion
mod_dav_svn
mod_dav_svn Configuration Directives
A. Subversion对于CVS用户
修订版本号如今不一样了
目录的版本
更多离线操做
区分状态和更新
分支和标签
元数据属性
冲突解决
二进制文件和转化
版本化的模块
认证
转化CVS版本库到Subversion
B. WebDAV和自动版本化
WebDAV基本概念
最初的WebDAV
DeltaV扩展
Subversion和DeltaV
自动版本化
客户端交互性
独立WebDAV应用程序
Microsoft Office,Dreamweaver,Photoshop
Cadaver,DAV Explorer
文件浏览器WebDAV扩展
Microsoft网络文件夹
Nautilus,Konqueror
WebDAV文件系统实现
WebDrive,NetDrive
Mac OS X
Linux davfs2
C. 第三方工具
客户端和插件
语言绑定
版本库转化
高级工具
版本库浏览工具
D. 版权
术语表

最先接触这本书是在2004上半年,当时Subversion 1.0刚刚发布,而我很快把它引入到咱们的项目当中,相对于CVS的简陋,Subversion显得很是的完备,是一个通过了深思熟虑的产品,是新一代开源项目的表明。算法

当 我看到这本免费共享的图书,注意到了它已经在O'Reilly出版,而网站上有最新的版本能够下载,对于这种开源文化赞叹不已,萌生了本身翻译这本书的想 法,可是苦于当时对DocBook很是不熟悉,因而使用文本格式,利用闲暇时间翻译了前四章,但后来琐事渐多,居然慢慢忘了此事。shell

一转眼到了2005年,Subversion 1.2发布了,个人注意力又转到了这个领域,正好我有了作一个网站的念头,因此就有了Subversion中文站(http://www.subversion.org.cn),而同时我也开始申请成为这本书的中文官方翻译。数据库

这 本书的官方翻译要求我必须使用DocBook,要求我必须有一个团队,因而我在这两方面进行了努力,因而有人开始与我并肩工做了。在这段翻译的时间里陆续 有人加入进来,按照时间顺序是rocksun、jerry、nashwang、gxio、MichaelDuan、viv、lifengliu2000、 genedna、luyongshou、leasun和nannan。可是必需要说明这不是对翻译贡献大小的排序,你们都在本身的能力范围内为这个翻译作 出了本身的贡献,感谢咱们成员的努力,也感谢许多对咱们提出建议的朋友。

开始的时候并无以为作好这件事有多难,但当看到翻译的东西本身都读不懂的时候,我感到了一种压力。若是这翻译还不如英文,咱们还有没有必要继续。好在在你们的支持下,我愈来愈喜欢这本书了,渐渐的发现本身能够把这本书看成本身的参考材料了。

但 是,我也有过许多疑惑,在中国人们彷佛只是把版本控制工具当作一个代码分享的工具,而没有把它融入到整个软件开发的生命周期当中,这也难怪,大多数中国软 件的寿命彷佛并不长,不须要那么多复杂的配置管理。因此咱们的这些翻译可以给你们带来多大的帮助要由中国软件的发展决定,但愿咱们的工做可以伴随着中国软 件的腾飞不断成长。

让咱们一块儿努力吧!

Rock Sun,青岛,2005年11月29日

一个不太好的常见问题列表(FAQ),经常并非由人们实际上的问题组成,而常常是由做者期待的问题组成。或许你曾经见过这种类型的问题:

这样的FAQ并非其字面意义上的FAQ,没有人会这样询问支持者,“怎样提升生产率?”相反,人们常常询问一些更具体的问题,像“怎样修改日程系统提早两天而不是提早一天去提醒被提醒人?” 等等。可是经过想象比去发现一个这样的问题列表更容易,编辑一个真实的问题列表须要持续的,有组织的工做,覆盖软件的整个生命周期,提出的问题必须被追 踪,要监控反馈,全部问题要收集为一个一致的,可查询的总体,而且可以反映全部用户的经验。这须要耐心,像实地博物学家同样严谨的态度,不该该有浮华的假 设,虚幻的断言—而须要开放的视野和精确的记录。

之 因此会喜欢这本书,是由于这本书非凡的成长过程,这体如今每一页里,这是做者与用户直接交流的结果。这一切的基础是Ben Collins-Sussman's关于Subversion常见问题邮件列表的研究:使用subversion一般的流程是怎样的?分支与标签同其它版 本控制系统的工做方式是同样的吗?我怎样知道某一处修改是谁作的?

因为天天看到相同问题的失落,Ben在2002年夏天努力工做了一个月,撰写了一本Subversion手册,一本六十页,涵盖了全部基础使用知识的手册。这本手册没有说明何时要结束,伴随着Subversion的版本,帮助用户开始最初的学习。当O'Reilly决定出版一本完备的Subversion图书的时候,最快捷的方式很明显,就是扩充这本书。

三 个联合做者于是面临了一个不寻常的机会。从职责上讲,他们的任务是以一些原始内容为基础,从头至尾写一个草稿。但实际上他们正在使用着一些丰富的自下而上 的原材料,像一条稳定的河流,也多是一口不可预料的间歇泉。Subversion被数以千计的用户采用,这些用户提供了大量的反馈,不只仅针对 Subversion,还包括业已存在的文档。

在 写这本书的过程里,Ben,Mike 和 Brian想鬼魂同样一直游荡在Subversion邮件列表和聊天室中,仔细的研究用户实际遇到的问题。监视这些反馈是他们在CollabNet工做的 一部分,这给他们开始写这本书时提供了巨大的便利。这本书创建在丰富经验的根基之上,并非在流沙同样的想象之上;它结合了用户手册和FAQ最好的一面, 在第一次阅读时,这种二元性并不明显,按照顺序,从前到后,这本书只是简单的从头至尾的关于软件细节的描述。有一个总的见解,有一个教程,有一章关于管理 配置,还有一些高级主题,固然也有一个命令参考和故障指南。只有当你过一段时间以后,返回来找一些特定问题的解决方案时,这种二元性才得以显现:这些生动 的细节必定来自不可预料的实际用例的提炼,大可能是源于用户的须要和视点。

固然,没人能够承诺这本书能够回答全部问题。尽管有时候一些前人提问的惊人一致性让你感受是心灵感应;你仍有可能在社区的知识库里摔跤,空手而归。若是有这种状况,最好的办法是写明问题发送email到users@subversion.tigris.org>, 做者还在那里关注着社区,不只仅封面提到的三位,还包括许多曾经做出修正与提供原始材料的人。从社区的视角,帮你解决问题只是逐步的调整这本书,进一步调 整Subversion自己以更合理的适合用户使用这样一个大工程的一个有趣的额外效用。他们渴望你的信息,不只仅能够帮助你,也由于能够帮助他们。与 Subversion这样活跃的自由软件项目一块儿,你并不孤单

让这本书将成为你的第一个伙伴。

Karl Fogel,芝加哥,2004年3月15日

若是C给你足够的绳子吊死你本身,试着用Subversion做为一种存放绳子的工具。” —Brian W. Fitzpatrick

在开源软件领域,并行版本系统(CVS)一直是版本控制的选择。恰如其分的是,CVS自己是一个自由软件,它的非限制性的技法和对网络操做的支持—容许大量的不一样地域分散的程序员能够共享他们工做的特性—很是符合开源软件领域合做的精神,CVS和它半混乱状态的开发模型成为了开源文化的基石。

但 是像许多其余工具同样,CVS开始显露出衰老的迹象。Subversion是一个被设计成为CVS继任者的新版本控制系统。设计者经过两个办法来争取现有 的CVS用户: 使用它构建一个开源软件系统的版本控制过程,从感受和体验上与CVS相似,同时Subversion努力弥补CVS许多明显的缺陷,结果就是不须要版本控 制系统一个大的革新。Subversion是很是强大、有用及灵活的工具。

这本书是为Subversion 1.2系列撰写的,咱们试图涵盖Subversion的全部内容,可是Subversion有一个兴盛和充满活力的开发社区,已经有许多特性和改进计划在新的版本中实现,可能会与目前这本书中的命令与细节不一致。

这本书的目标读者很是的普遍—从从未使用过版本控制的新手到经验丰富的系统管理员。根据你的基础,特定的章节可能对你更有用,下面的内容能够看做是为各种用户提供的“推荐阅读清单”:

资深管理员

假设你之前已经使用过CVS,但愿获得一个Subversion服务器而且尽快运行起来,第 5 章 版本库管理第 6 章 配置服务器将会告诉你怎样创建第一个版本库,而且使之在网络上可用,此后,根据你的CVS使用经验,第 3 章 指导教程附录 A, Subversion对于CVS用户告诉你怎样使用Subversion客户端。

新用户

你的管理员已经为你准备好了Subversion服务,你将学习如何使用客户端。若是你没有使用过版本控制系统(像CVS),那么第 2 章 基本概念第 3 章 指导教程是重要的介绍,若是你是CVS的老手,最好从第3章和附录A开始。

高级用户

不管你只是个使用者仍是管理员,最终你的项目会长大,你想经过Subversion做许多高级的事情,像如何使用分支和执行合并(第 4 章 分支与合并),怎样使用Subversion的属性支持,怎样配制运行参数(第 7 章 高级主题)等等。这两章一开始并不重要,但你适应了基本操做以后必定要读一下。

开发者

大概你已经很熟悉Subversion了,你想扩展它并在它的API基础之上开发新软件,第 8 章 开发者信息将是为你准备的。

这本书以一个参考材料做为结束—第 9 章 Subversion彻底参考包括了全部命令的参考,这个附录包括了许多有用的主题,当你完成了本书的阅读,你会常常去看这个章节。

这一部分包括书中各类约定。

如下是章节和其中的内容介绍:

第 1 章 介绍

记述了Subversion的历史与特性、架构、组件和安装方法,还包括一个快速入门指南。

第 2 章 基本概念

解释了版本控制的基础知识,介绍了不一样的版本模型,随同讲述了Subversion的版本库,工做拷贝和修订版本的概念。

第 3 章 指导教程

带领你做为一个Subversion用户开始工做,示范了怎样使用Subversion得到、修改和提交数据。

第 4 章 分支与合并

讨论分支、合并与标签,包括一个最佳实践,一般的用例,怎样取消修改,以及怎样从一个分支转到另外一个分支。

第 5 章 版本库管理

讲述Subversion版本库的基本概念,怎样创建、配置和维护版本库,以及你能够使用的工具。

第 6 章 配置服务器

解释了怎样配置Subversion服务器,以及三种访问版本库的方式,HTTPsvn协议和本地访问。这里也介绍了认证的细节,以及受权与匿名访问方式。

第 7 章 高级主题

研究Subversion客户配置文件,文件和目录属性,怎样忽略工做拷贝中的文件,怎样引入外部版本树到工做拷贝,最后介绍了如何掌握卖主分支。

第 8 章 开发者信息

介绍了Subversion的核心,Subversion文件系统,以及从程序员的角度如何看待工做拷贝的管理区域,介绍了如何使用公共APIs写程序使用Subversion,最重要的是,怎样投身到Subversion的开发当中去。

第 9 章 Subversion彻底参考

深刻研究研究全部的命令,包括 svnsvnadmin、和svnlook以及大量的相关实例

附录 A, Subversion对于CVS用户

比较Subversion与CVS的异同点,消除多年使用CVS养出的坏习惯的建议,包括subversion版本号、标记版本的目录、离线操做、updatestatus、分支、标签、元数据、冲突和认证。

附录 B, WebDAV和自动版本化

描述了WebDAV与DeltaV的细节,和怎样将你的Subversion版本库做为可读/写的DAV共享装载。

附录 C, 第三方工具

讨论一些支持和使用Subversion的工具,包括可选的客户端工具,版本库浏览工具等等。

这本书是做为Subversion项目的文档,由开发者开始撰写的,后来成为一个独立工做并进行了重写,所以,它一直有一个免费许可证(见附录 D, 版权。)实际上,这本书是在公众关注中写出来的,做为Subversion的一部分,它有两种含义:

  • 你一直能够在Subversion的版本库里找到本书的最新版本。

  • 对于这本书,你能够任意分发或者修改—它是免费许可证,固然,相对于发布你的私有版本,你最好向Subversion开发社区提供反馈。为了可以参与到社区,见“为Subversion作贡献”一节来学习如何加入到社区。

一个相对新的在线版本能够在http://svnbook.red-bean.com找到。

没有Subversion就没有可能(或者有用)有这本书,因此做者很乐意去感谢Brian Behlendorf和CollabNet,有眼光开始这样一个冒险和野心勃勃的开源项目;Jim Blandy给了Subversion这个名字和最初的设计—咱们爱你。还有Karl Fogel,伟大社区领导和好朋友。 [1]

感谢O'Reilly和咱们的编辑Linda Mui和Tatiana对咱们的耐心的支持。

最后,咱们要感谢数不清的曾经为社区做出贡献的人们,他们提供了非正式的审计、建议和修正:这必定不是一个最终的完整列表,离开了这些人的帮助,这本书不会这样完整和正确:Jani Averbach, Ryan Barrett, Francois Beausoleil, Jennifer Bevan, Matt Blais, Zack Brown, Martin Buchholz, Brane Cibej, John R. Daily, Peter Davis, Olivier Davy, Robert P. J. Day, Mo DeJong, Brian Denny, Joe Drew, Nick Duffek, Ben Elliston, Justin Erenkrantz, Shlomi Fish, Julian Foad, Chris Foote, Martin Furter, Dave Gilbert, Eric Gillespie, Matthew Gregan, Art Haas, Greg Hudson, Alexis Huxley, Jens B. Jorgensen, Tez Kamihira, David Kimdon, Mark Benedetto King, Andreas J. Koenig, Nuutti Kotivuori, Matt Kraai, Scott Lamb, Vincent Lefevre, Morten Ludvigsen, Paul Lussier, Bruce A. Mah, Philip Martin, Feliciano Matias, Patrick Mayweg, Gareth McCaughan, Jon Middleton, Tim Moloney, Mats Nilsson, Joe Orton, Amy Lyn Pilato, Kevin Pilch-Bisson, Dmitriy Popkov, Michael Price, Mark Proctor, Steffen Prohaska, Daniel Rall, Tobias Ringstrom, Garrett Rooney, Joel Rosdahl, Christian Sauer, Larry Shatzer, Russell Steicke, Sander Striker, Erik Sjoelund, Johan Sundstroem, John Szakmeister, Mason Thomas, Eric Wadsworth, Colin Watson, Alex Waugh, Chad Whitacre, Josef Wolf, Blair Zajac, 以及整个Subversion社区。

版本控制是管理信息变化的艺术,它很早就成为了程序员重要的工具,程序员常常会花时间作一点小修改而后次日又把它改回来。可是版本控制的做用不只在软件开发领域,任何须要管理频繁信息改变的地方都须要它,这就是Subversion发挥的舞台。

这一章是一个对Subversion高层次的介绍—它是什么;它能作什么;它是怎样作到的。

早在2000年,CollabNet, Inc. (http://www.collab.net)就开始寻找CVS替代产品的开发人员,CollabNet提供了一个协做软件套件叫作CollabNet企业版(CEE)[2],它的一个组件是版本控制系统。尽管SourceCast在初始时使用CVS做为其版本控制系统,可是CVS的局限性在一开始就很明显,CollabNet知道早晚要找到一个更好的替代品。遗憾的是,CVS成为了开源世界事实上的标准,由于没有更好的产品,至少是没有能够自由使用的。因此CollabNet决定写一个新的版本控制系统,创建在CVS思想之上的,可是修正其错误和不合理的特性。

2000年2月,他们联系Open Source Development with CVS(Coriolis, 1999)的做者Karl Fogel,而且询问他是否但愿为这个新项目工做,巧合的是,当时Karl正在与朋友Jim Blandy讨论设计一个新的版本控制系统。在1995年,他们两个曾经开办一个提供CVS支持的公司Cyclic Software,尽管他们最终卖掉了公司,但仍是每天使用CVS进行平常工做,在使用CVS时的挫折最终促使他们认真地去考虑如何管理标记版本的数据, 并且他们当时不只仅提出了“Subversion”这个名字,而且作出了Subversion版 本库的基础设计。因此当CollabNet提出邀请的时候,Karl立刻赞成为这个项目工做,同时Jim也获得了他的雇主,Red Hat软件赞助他到这个项目并提供了一个宽松的时间。CollabNet雇佣了Karl和Ben Collins Sussman,详细的设计从三月开始,在Behlendorf 、CollabNet、Jason Robbins 和 Greg Stein(当时是一个独立开发者,活跃在WebDAV/DeltaV系统规范阶段)的恰当激励的帮助下,Subversion很快吸引了许多活跃的开发 者,结果是许多有CVS经验的人们很乐于有机会为这个项目作些事情。

最初的设计小组固定在简单的目标上,他们不想在版本控制方法学中开垦处女地,他们只是但愿修正CVS,他们决定Subversion匹配CVS的特性,保 留相同的开发模型,但不复制CVS明显的缺陷。尽管它不须要成为CVS的继任者,它也应该与CVS保持足够的类似性,使得CVS用户能够轻松的作出转换。

通过14个月的编码,2001年8月31日,Subversion本身可以“成为服务”了,开发者中止使用CVS保存Subversion的代码,而使用Subversion自己。

当CollabNet开始这个项目的时候,曾经资助了大量的工做(它为全职的Subversion开发者提供薪水),Subversion像许多开源项目 同样,被一些激励知识界精英的宽松透明的规则支配着。CollabNet的版权许可证彻底符合Debian的自由软件方针,也就是说,任何人能够自由的下 载,修改和从新发布,不须要通过CollabNet或其余人的容许。

当讨论Subversion为版本控制领域带来的特性的时候,经过学习它在CVS基础上所做的改进会是比较有效的方法。若是你不熟悉CVS,你会不太明白全部的特性,若是你根本就不熟悉版本控制,你会瞪着眼无所适从,你最好首先阅读一下第 2 章 基本概念,它提供了一个版本控制的简单介绍。

Subversion提供:

版本化的目录

CVS只记录单个文件的历史,可是Subversion实现了一个能够跟踪目录树更改的“虚拟”版本化文件系统,文件目录都是有版本的。

真实的版本历史

由于CVS只记录单个文件的版本,对于拷贝和更名—这些文件常常发生的操做,会改变一个目录的内容—在CVS中并不支持。在CVS里你也不能够用一个彻底 不一样的文件覆盖原来的同名文件而又不继承原来文件的历史。经过Subversion,你能够对文件或是目录进行增长、拷贝和更名操做,也能够新增一个具备 干净历史的文件。

原子提交

一系列的改动,要么所有提交到版本库,要么一个也不提交,这样可让用户构建一个所要提交修改的逻辑块,防止部分修改提交到版本库。

版本化的元数据

每个文件或目录都有一套属性—键和它们的值,你能够创建并存储任何键/值对,属性也是随时间的流逝而归入版本控制的,很像文件的内容。

可选的网络层

Subversion在版本库访问方面有一个抽象概念,利于人们去实现新的网络机制,Subversion能够做为一个扩展模块与Apache结合,这给 了Subversion在稳定性和交互性方面很大的好处,能够直接使用服务器的特性—认证、受权和传输压缩等等。也有一个轻型的,单独运行的 Subversion服务,这个服务使用本身的协议能够轻松的用SSH封装。

一致的数据操做

Subversion表示文件是创建在二进制文件区别算法基础上的,对于文本(可读)和二进制(不可读)文件具有一致的操做方式,两种类型的文件都压缩存放在版本库中,区别信息是在网络上双向传递的。

有效率的分支和标签

分支与标签的代价不与工程的大小成比例,Subversion创建分支与标签时只是拷贝整个工程,使用了一种相似于硬连接的机制,于是这类操做一般只会花费不多而且相对固定的时间。

可修改性

Subversion没有历史负担,它由一系列良好的共享C库实现,具备定义良好的API,这使得Subversion很是容易维护,能够轻易的用其余语言操做。

Subversion创建在一个可移植层上,叫作APR—Apache Portable Runtime library,APR库提供了许多Subversion在多种操做系统上须要的功能:磁盘访问、内存管理等等。虽然Subversion能够使用 Apache做为服务器程序,这种对APR的依赖并不意味着Apache是必需的组件,APR是能够独立使用的库。这意味着Subversion能够在所 有可运行Apache服务器的平台上工做:Windows、Linux、各类BSD、Mac OS X、Netware以及其余。

最简单的安装办法就是下载相应操做系统的二进制包,Subversion的网站(http://subversion.tigris.org)上一般会有志愿者提供的包能够下载,对于微软操做系统,网站上一般会有图形化的安装包,对于类Unix系统,你能够使用它们自己的打包系统(PRMs、DEBs、ports tree等等)获得Subversion。

你也能够选择从源代码直接编译Subversion,从网站下载最新的源代码,解压缩,根据INSTALL文件的指导进行编译。注意,经过这些源代码能够彻底编译访问服务器的命令行客户端工具(一般是apr,apr-util和neno库)。可是可选部分有许多依赖,如Berkeley DB和Apache httpd。若是你但愿作一个彻底的编译,肯定你有全部INSTALL文件中记述的包。若是你计划经过Subversiong自己工做,你能够使用客户端程序取得最新的,带血的源代码,这部份内容见“取得源代码”一节

许多人为“从头至尾”的方式读一本介绍有趣新技术的书感到发愁,这一小节是一个很短的介绍,给许多“实用”的用户一个实战的机会,若是你是一个喜欢经过实验进行学习的用户,如下将告诉你怎么作,相对应,咱们给出这本书相关的连接。

若是版本控制或者Subversion和CVS都用到的“拷贝-修改-合并”模型对于你来讲是彻底的新概念,在进一步阅读以前,你首先要读第 2 章 基本概念

注意

如下的例子假定你有了1.2或更新的Subversion程序(运行svn --version来检查版本)。

Subversion存储全部版本控制的数据到一个中心版本库,做为开始,新建一个版本库:

$ svnadmin create /path/to/repos
$ ls /path/to/repos
conf/ dav/ db/ format hooks/ locks/ README.txt

这个命令创建了一个新的目录/path/to/repos,包含了一个Subversion版本库。这个目录保存了一些数据库文件,你打开后看不到你的已经版本化的文件。更多的版本库建立和维护信息,见第 5 章 版本库管理

Subversion没有“项目”的概念,版本库只是一个虚拟的版本化文件系统,能够存放你想要得任何文件。有的管理员倾向于一个版本库只存放一个项目,有的则喜欢存放多个项目到一个版本库不一样的目录里,每中方式的优势将会在“选择一种版本库布局”一节讨论。每种方式,版本库都是以“项目”管理文件和目录,因此或许你会在整本书中常常发现项目这个词,须要记住咱们只是在谈论版本库中的一些目录(或者是一组目录)。

在这个例子里,咱们假定你已经有了一些但愿导入到Subversion版本库的项目(一组文件和目录)。首先把这些条目整理到同一个叫作myproject(或任何名称)的目录里,你的项目要有branchestagstrunk三个顶级目录,后面你就会知道这样作的缘由。trunk目录保存全部的数据,而branchestags都是空的:

/tmp/myproject/branches/
/tmp/myproject/tags/
/tmp/myproject/trunk/
foo.c
bar.c
Makefile

branchestagstrunk子目录不是Subversion必需的,它们只是稍候你就会但愿使用的流行习惯。

一旦你你已经准备好了数据,就能够使用svn import命令(见svn import”一节)将其导入到版本库:

$ svn import /tmp/myproject file:///path/to/repos/myproject -m "initial import"
Adding /tmp/myproject/branches
Adding /tmp/myproject/tags
Adding /tmp/myproject/trunk
Adding /tmp/myproject/trunk/foo.c
Adding /tmp/myproject/trunk/bar.c
Adding /tmp/myproject/trunk/Makefile

Committed revision 1.
$

如今版本库包含了这个目录树的数据,如前所述,直接察看版本库看不到文件和目录;它们存放在数据库当中,可是版本库假想的文件系统如今保存了顶级的目录myproject,其中保存了你的数据。

注意最初的/tmp/myproject并无改变,Subversion并无处理它(实际上,你能够随意删除这个目录)。为了开始处理版本库数据,你须要建立一个新的包含数据的“工做拷贝”,这是一个私有工做区。从Subversion版本库里“check out”出一个myproject/trunk目录的工做拷贝:

$ svn checkout file:///path/to/repos/myproject/trunk myproject
A myproject/foo.c
A myproject/bar.c
A myproject/Makefile

Checked out revision 1.

你如今在myproject目录里有了一个版本库的我的拷贝,你能够编辑你的工做备份中的文件,而且提交到版本库。

  • 进入到你的工做备份,编辑一个文件的内容。

  • 运行svn diff来查看你的修改的标准区别输出。

  • 运行svn commit来提交你的改变到版本库。

  • 运行svn update将你的工做拷贝与版本库“同步”。

对于你对工做拷贝可作操做的彻底教程能够察看第 3 章 指导教程

目前,你能够选择使你的版本库在网络上可见,能够参考第 6 章 配置服务器,学习使用不一样的服务器以及配置。



[2] 也有一个针对小团队的CollabNet团队版(CTE)。

这一章是对Subversion一个简短和随意的介绍,若是你对版本控制很陌生,这一章节彻底为你准备的,咱们从讨论基本概念开始,深刻理解Subversion的思想,而后展现许多简单的实例。

尽管咱们的例子展现了人们如何分享程序源代码,仍然要记住Subversion能够控制全部类型的文件—它并无限制在只为程序员工做。

版本控制系统的核心任务是提供协做编辑和数据共享,可是不一样的系统使用不一样的策略来达到目的。

全部的版本控制系统都须要解决这样一个基础问题:怎样让系统容许用户共享信息,而不会让他们因意外而互相干扰?版本库里意外覆盖别人的更改很是的容易。

考虑图 2.2 “须要避免的问题”的情景,咱们有两个共同工做者,Harry和Sally,他们想同时编辑版本库里的同一个文件,若是首先Harry保存它的修改,过了一会,Sally可能凑巧用本身的版本覆盖了这些文件,Harry的更改不会永远消失(由于系统记录了每次修改),Harry全部的修改不会出如今Sally的文件中,因此Harry的工做仍是丢失了—至少是从最新的版本中丢失了—并且是意外的,这就是咱们要明确避免的状况!

许多版本控制系统使用锁定-修改-解锁这种机制解决这种问题,在这样的系统里,在一个时间段里版本库的一个文件只容许被一我的修改。首先在修改以前,Harry要“锁定” 住这个文件,锁定很像是从图书馆借一本书,若是Harry锁住这个文件,Sally不能作任何修改,若是Sally想请求获得一个锁,版本库会拒绝这个请 求。在Harry结束编辑而且放开这个锁以前,她只能够阅读文件。Harry解锁后,就要换班了,Sally获得本身的轮换位置,锁定而且开始编辑这个文 件。图 2.3 “锁定-修改-解锁 方案”描述了这样的解决方案。

锁定-修改-解锁模型有一点问题就是限制太多,常常会成为用户的障碍:

Subversion,CVS和一些版本控制系统使用拷贝-修改-合并模型,在这种模型里,每个客户联系项目版本库创建一个我的工做拷贝—版本库中文件和目录的本地映射。用户并行工做,修改各自的工做拷贝,最终,各个私有的拷贝合并在一块儿,成为最终的版本,这种系统一般能够辅助合并操做,可是最终要靠人工去肯定正误。

这是一个例子,Harry和Sally为同一个项目各自创建了一个工做拷贝,工做是并行的,修改了同一个文件A,Sally首先保存修改到版本库,当Harry想去提交修改的时候,版本库提示文件A已经过时,换句话说,A在他上次更新以后已经更改了,因此当他经过客户端请求合并版本库和他的工做拷贝以后,碰巧Sally的修改和他的不冲突,因此一旦他把全部的修改集成到一块儿,他能够将工做拷贝保存到版本库,图 2.4 “拷贝-修改-合并 方案”图 2.5 “拷贝-修改-合并 方案(续)”展现了这一过程。

可是若是Sally和Harry的修改交迭了该怎么办?这种状况叫作冲突, 这一般不是个大问题,当Harry告诉他的客户端去合并版本库的最新修改到本身的工做拷贝时,他的文件A就会处于冲突状态:他能够看到一对冲突的修改集, 并手工的选择保留一组修改。须要注意的是软件不能自动的解决冲突,只有人能够理解并做出智能的选择,一旦Harry手工的解决了冲突—也许须要与 Sally讨论—它能够安全的把合并的文件保存到版本库。

拷贝-修改-合并模型感受是有一点混乱,但在实践中,一般运行的很平稳,用户能够并行的工做,没必要等待别人,当工做在同一个文件上时,也不多会有交迭发生,冲突并不频繁,处理冲突的时间远比等待解锁花费的时间少。

最后,一切都要归结到一条重要的因素:用户交流。当用户交流贫乏,语法和语义的冲突就会增长,没有系统能够强制用户完美的交流,没有系统能够检测语义上的冲突,因此没有任何证据可以承诺锁定系统能够防止冲突,实践中,锁定除了约束了生产力,并无作什么事。

是时候从抽象转到具体了,在本小节,咱们会展现一个Subversion真实使用的例子。

你已经阅读过了关于工做拷贝的内容,如今咱们要讲一讲客户端怎样创建和使用它。

一个Subversion工做拷贝是你本地机器一个普通的目录,保存着一些文件,你能够任意的编辑文件,并且若是是源代码文件,你能够像日常同样编译,你 的工做拷贝是你的私有工做区,在你明确的作了特定操做以前,Subversion不会把你的修改与其余人的合并,也不会把你的修改展现给别人,你甚至能够 拥有同一个项目的多个工做拷贝。

当你在工做拷贝做了一些修改而且确认它们工做正常以后,Subversion提供了一个命令能够“发布”你的修改给项目中的其余人(经过写到版本库),若是别人发布了各自的修改,Subversion提供了手段能够把这些修改与你的工做目录进行合并(经过读取版本库)。

一个工做拷贝也包括一些由Subversion建立并维护的额外文件,用来协助执行这些命令。一般状况下,你的工做拷贝每个文件夹有一个以.svn为名的文件夹,也被叫作工做拷贝管理目录,这个目录里的文件可以帮助Subversion识别哪个文件作过修改,哪个文件相对于别人的工做已通过期了。

一个典型的Subversion的版本库常常包含许多项目的文件(或者说源代码),一般每个项目都是版本库的子目录,在这种安排下,一个用户的工做拷贝每每对应版本库的的一个子目录。

举一个例子,你的版本库包含两个软件项目,paintcalc。每一个项目在它们各自的顶级子目录下,见图 2.6 “版本库的文件系统”

为了获得一个工做拷贝,你必须检出check out)版本库的一个子树,(术语“check out”听起来像是锁定或者保存资源,实际上不是,只是简单的获得一个项目的私有拷贝),举个例子,你检出 /calc,你能够获得这样的工做拷贝:

$ svn checkout http://svn.example.com/repos/calc
A calc/Makefile
A calc/integer.c
A calc/button.c
Checked out revision 56.

$ ls -A calc
Makefile integer.c button.c .svn/

列表中的A表示Subversion增长了一些条目到工做拷贝,你如今有了一个/calc的我的拷贝,有一个附加的目录—.svn—保存着前面说起的Subversion须要的额外信息。

假定你修改了button.c,由于.svn目录记录着文件的修改日期和原始内容,Subversion能够告诉你已经修改了文件,然而,在你明确告诉它以前,Subversion不会将你的改变公开。将改变公开的操做被叫作提交(committing,或者是checking in)修改到版本库。

发布你的修改给别人,你能够使用Subversion的提交(commit)命令:

$ svn commit button.c
Sending button.c
Transmitting file data .
Committed revision 57.

这时你对button.c的修改已经提交到了版本库,若是其余人取出了/calc的一个工做拷贝,他们会看到这个文件最新的版本。

假设你有个合做者,Sally,她和你同时取出了/calc的一个工做拷贝,你提交了你对button.c的修改,Sally的工做拷贝并无改变,Subversion只在用户要求的时候才改变工做拷贝。

要使项目最新,Sally能够要求Subversion更新她的工做备份,经过使用更新(update)命令,将结合你和全部其余人在她上次更新以后的改变到她的工做拷贝。

$ pwd
/home/sally/calc

$ ls -A
.svn/ Makefile integer.c button.c

$ svn update
U button.c
Updated to revision 57.

svn update命令的输出代表Subversion更新了button.c的内容,注意,Sally没必要指定要更新的文件,subversion利用.svn以及版本库的进一步信息决定哪些文件须要更新。

一个svn commit操做能够做为一个原子事务操做发布任意数量文件和目录的修改,在你的工做拷贝里,你能够改变文件内容、删除、更名和拷贝文件和目录,而后做为一个总体提交。

在版本库中,每一次提交被看成一次原子事务操做:要么全部的改变发生,要么都不发生,Subversion努力保持原子性以应对程序错误、系统错误、网络问题和其余用户行为。

每当版本库接受了一个提交,文件系统进入了一个新的状态,叫作一次修订(revision),每个修订版本被赋予一个独一无二的天然数,一个比一个大,初始修订号是0,只建立了一个空目录,没有任何内容。

图 2.7 “版本库”能够更形象的描述版本库,想象有一组修订号,从0开始,从左到右,每个修订号有一个目录树挂在它下面,每个树好像是一次提交后的版本库“快照”。

须要特别注意的是,工做拷贝并不必定对应版本库中的单个修订版本,他们可能包含多个修订版本的文件。举个例子,你从版本库检出一个工做拷贝,最近的修订号是4:

calc/Makefile:4
integer.c:4
button.c:4

此刻,工做目录与版本库的修订版本4彻底对应,然而,你修改了button.c而且提交以后,假设没有别的提交出现,你的提交会在版本库创建修订版本5,你的工做拷贝会是这个样子的:

calc/Makefile:4
integer.c:4
button.c:5

假设此刻,Sally提交了对integer.c的修改,创建修订版本6,若是你使用svn update来更新你的工做拷贝,你会看到:

calc/Makefile:6
integer.c:6
button.c:6

Sally对integer.c的改变会出如今你的工做拷贝,你对button.c的改变还在,在这个例子里,Makefile在四、五、6修订版本都是同样的,可是Subversion会把他的Makefile的修订号设为6来代表它是最新的,因此你在工做拷贝顶级目录做一次干净的更新,会使得全部内容对应版本库的同一修订版本。

对于工做拷贝的每个文件,Subversion在管理区域.svn/记录两项关键的信息:

给定这些信息,经过与版本库通信,Subversion能够告诉咱们工做文件是处与以下四种状态的那一种:

这看起来须要记录不少事情,可是svn status命令能够告诉你工做拷贝中文件的状态,关于此命令更多的信息,请看svn status”一节

做 为一个广泛原理,Subversion努力作到尽量的灵活,一个特殊的灵活特性就是让工做拷贝包含不一样工做修订版本号的文件和目录,不幸的是,这个灵活 性会让许多新用户感到迷惑。若是上一个混合修订版本的例子让你感到困惑,这里是一个为什么有这种特性和如何利用这个特性的基础介绍。

事实上,每次运行svn commit,你的工做拷贝都会进入混合多个修订版本的状态,刚刚提交的文件会比其余文件有更高的修订版本号。通过屡次提交(之间没有更新),你的工做拷贝会彻底是混合的修订版本。即便只有你一我的使用版本库,你依然会见到这个现象。为了检验混合工做修订版本,能够使用svn status --verbose命令(详细信息见svn status”一节)。

一般,新用户对于工做拷贝的混合修订版本一无所知,这会让人糊涂,由于许多客户端命令对于所检验条目的修订版本很敏感。例如svn log命令显示一个文件或目录的历史修改信息(见svn log”一节),当用户对一个工做拷贝对象调用这个命令,他们但愿看到这个对象的整个历史信息。可是若是这个对象的修订版本已经至关老了(一般由于很长时间没有运行svn update),此时会显示比这个对象更老的历史。

如今,咱们将要深刻到Subversion到使用细节当中,完成本章,你将学会全部平常使用的Subversion命令,你将从一个初始化检出开始,作出修改并检查,你也将会学到如何将别人的修改取到工做拷贝,检查他们,并解决全部可能发生的冲突。

这一章并非Subversion命令的彻底列表—而是你将会遇到的最经常使用任务的介绍,这一章假定你已经读过而且理解了第 2 章 基本概念,并且熟悉Subversion的模型,若是想查看全部命令的参考,见第 9 章 Subversion彻底参考

在继续以前你必定要知道如何识别版本库的一个修订版本,像你在“修订版本”一节看到的,一个修订版本就是版本库的一个“快照”,当你的版本库持续扩大,你必须有手段来识别这些快照。

你能够使用--revision-r)参数来选择特定修订版本(svn --revision REV),你也能够指定在两个修订版本之间的一个范围 (svn --revision REV1:REV2)。你能够在Subversion中经过修订版本号、关键字或日期指定特定修订版本。

Subversion客户端能够理解一些修订版本关键字,这些关键字能够用来代替--revision的数字参数,这会被Subversion解释到特定版本:

下面是一些关键字使用的例子,不要担忧如今没有意义,咱们将在本章的后面解释这些命令:

$ svn diff --revision PREV:COMMITTED foo.c
# shows the last change committed to foo.c

$ svn log --revision HEAD
# shows log message for the latest repository commit

$ svn diff --revision HEAD
# compares your working file (with local changes) to the latest version
# in the repository

$ svn diff --revision BASE:HEAD foo.c
# compares your “pristine” foo.c (no local changes) with the
# latest version in the repository

$ svn log --revision BASE:HEAD
# shows all commit logs since you last updated

$ svn update --revision PREV foo.c
# rewinds the last change on foo.c
# (foo.c's working revision is decreased)

这些关键字容许你执行许多经常使用(并且有用)的操做,而没必要去查询特定的修订版本号,或者记住本地拷贝的修订版本号。

在任何你使用特定版本号和版本关键字的地方,你也能够在“{}”中使用日期,你也可经过日期或者版本号配合使用来访问一段时间的修改!

以下是一些Subversion可以接受的日期格式,注意在日期中有空格时须要使用引号。

$ svn checkout --revision {2002-02-17}
$ svn checkout --revision {15:30}
$ svn checkout --revision {15:30:00.200000}
$ svn checkout --revision {"2002-02-17 15:30"}
$ svn checkout --revision {"2002-02-17 15:30 +0230"}
$ svn checkout --revision {2002-02-17T15:30}
$ svn checkout --revision {2002-02-17T15:30Z}
$ svn checkout --revision {2002-02-17T15:30-04:00}
$ svn checkout --revision {20020217T1530}
$ svn checkout --revision {20020217T1530Z}
$ svn checkout --revision {20020217T1530-0500}

当你指定一个日期,Subversion会在版本库找到接近这个日期的最新版本:

$ svn log --revision {2002-11-28}
------------------------------------------------------------------------
r12 | ira | 2002-11-27 12:31:51 -0600 (Wed, 27 Nov 2002) | 6 lines

你能够使用时间段,Subversion会找到这段时间的全部版本:

$ svn log --revision {2002-11-20}:{2002-11-29}

咱们也曾经指出,你能够混合日期和修订版本号:

$ svn log --revision {2002-11-20}:4040

用 户必定要认识到这种精巧会成为处理日期的绊脚石,由于一个版本的时间戳是做为一个属性存储的—不是版本化的,而是能够编辑的属性—版本号的时间戳能够被修 改,从而创建一个虚假的年表明,也能够被彻底删除。这将大大破坏Subversion的这种时间—版本转化功能的表现。

大多数时候,你会使用checkout从版本库取出一个新拷贝开始使用Subversion,这样会在本机建立一个项目的本地拷贝,这个拷贝包括版本库中的HEAD(最新的)版本:

$ svn checkout http://svn.collab.net/repos/svn/trunk
A trunk/subversion.dsw
A trunk/svn_check.dsp
A trunk/COMMITTERS
A trunk/configure.in
A trunk/IDEAS

Checked out revision 2499.

尽管上面的例子取出了trunk目录,你也彻底能够经过输入特定URL取出任意深度的子目录:

$ svn checkout http://svn.collab.net/repos/svn/trunk/doc/book/tools
A tools/readme-dblite.html
A tools/fo-stylesheet.xsl
A tools/svnbook.el
A tools/dtd
A tools/dtd/dblite.dtd

Checked out revision 2499.

由于Subversion使用“拷贝-修改-合并”模型而不是“锁定-修改-解锁”模型(见第 2 章 基本概念),你能够开始修改工做拷贝中的目录和文件,你的工做拷贝和你的系统中的其它文件和目录彻底同样,你能够编辑并改变它,移动它,也能够彻底的删掉它,把它忘了。

注意

由于你的工做拷贝“同你的系统上的文件和目录没有什么区别”,若是你但愿从新规划工做拷贝,你必需要让Subversion知道,当你但愿拷贝或者移动工做拷贝的一个项目时,你应该使用svn copy或者 svn move而不要使用操做系统的命令,咱们会在之后的章节详细介绍。

除非你准备好了提交一个新文件或目录,或改变了已存在的,不然没有必要通知Subversion你作了什么。

由于你能够使用版本库的URL做为惟一参数取出一个工做拷贝,你也能够在版本库URL以后指定一个目录,这样会将你的工做目录放到你的新目录,举个例子:

$ svn checkout http://svn.collab.net/repos/svn/trunk subv
A subv/subversion.dsw
A subv/svn_check.dsp
A subv/COMMITTERS
A subv/configure.in
A subv/IDEAS

Checked out revision 2499.

这样将把你的工做拷贝放到subv而不是和前面那样放到trunk

Subversion有许多特性、选项和华而不实的高级功能,但平常的工做中你只使用其中的一小部分,有一些只在特殊状况才会使用,在这一节里,咱们会介绍许多你在平常工做中常见的命令。

典型的工做周期是这样的:

如今你能够开始工做而且修改你的工做拷贝了,你很容易决定做出一个修改(或者是一组),像写一个新的特性,修正一个错误等等。这时能够使用的Subversion命令包括svn addsvn deletesvn copysvn move。若是你只是修改版本库中已经存在的文件,在你提交以前,没必要使用上面的任何一个命令。你能够对工做备份做的修改包括:

修改文件,能够使用文本编辑器、字处理软件、图形程序或任何你经常使用的工具,Subverion处理二进制文件像同文本文件同样—效率也同样。

这些是经常使用的能够修改目录树结构的子命令(咱们会在后面包括svn importsvn mkdir)。

svn add foo

预约将文件、目录或者符号链foo添加到版本库,当你下次提交后,foo会成为其父目录的一个子对象。注意,若是foo是目录,全部foo中的内容也会预约添加进去,若是你只想添加foo自己,使用--non-recursive-N)参数。

svn delete foo

预约将文件、目录或者符号链foo从版本库中删除掉,若是foo是文件,它立刻从工做拷贝中删除,若是是目录,不会被删除,可是Subversion准备好删除了,当你提交你的修改,foo就会在你的工做拷贝和版本库中被删除。[3]

svn copy foo bar

创建一个新的项目bar做为foo的复制品,当在下次提交时会将bar添加到版本库,这种拷贝历史会记录下来(按照来自foo的方式记录),svn copy并不创建中介目录。

svn move foo bar

这个命令与与运行svn copy foo bar; svn delete foo彻底相同,bar做为foo的拷贝准备添加,foo已经预约要被删除,svn move不创建中介的目录。

当你完成修改,你须要提交他们到版本库,可是在此以前,检查一下作过什么修改是个好主意,经过提交前的检查,你能够整理一份精确的日志信息,你也能够发现你不当心修改的文件,给了你一次恢复修改的机会。此外,这是一个审查和仔细察看修改的好机会,你可经过命令svn statussvn diffsvn revert精确地察看所作的修改。你能够使用前两个命令察看工做拷贝中的修改,使用第三个来撤销部分(或所有)的修改。

Subversion已经被优化来帮助你完成这个任务,能够在不与版本库通信的状况下作许多事情,详细来讲,对于每个文件,你的的工做拷贝在.svn包含了一个“原始的”拷贝,因此Subversion能够快速的告诉你那些文件修改了,甚至容许你在不与版本库通信的状况下恢复修改。

相对于其余命令,你会更多地使用这个svn status命令。

若是你在工做拷贝的顶级目录运行不带参数的svn status命令,它会检测你作的全部的文件或目录的修改,如下的例子是来展现svn status可能返回的状态码(注意,#以后的不是svn status打印的)。

  L     some_dir            # svn已经在.svn目录锁定了some_dir 
M bar.c # bar.c的内容已经在本地修改过了
M baz.c # baz.c属性有修改,但没有内容修改
X 3rd_party # 这个目录是外部定义的一部分
? foo.o # svn并无管理foo.o
! some_dir # svn管理这个,但它可能丢失或者不完
~ qux # 做为file/dir/link进行了版本控制,但类型已经改变
I .screenrc # svn无论理这个,配置肯定要忽略它
A + moved_dir # 包含历史的添加,历史记录了它的来历
M + moved_dir/README # 包含历史的添加,并有了本地修改
D stuff/fish.c # 这个文件预约要删除
A stuff/loot/bloo.h # 这个文件预约要添加
C stuff/loot/lump.c # 这个文件在更新时发生冲突

C stuff/loot/glub.c # 文件在更新时发生属性冲突
R xyz.c # 这个文件预约要被替换
S stuff/squawk # 这个文件已经跳转到了分支
K dog.jpg # 文件在本地锁定;有锁定令牌
O cat.jpg # 文件在版本库被其余用户锁定
B bird.jpg # 文件本地锁定,但锁定发生错误
T fish.jpg # 文件本地锁定,但锁定丢失

在这种格式下,svn status打印五列字符,紧跟一些空格,接着是文件或者目录名。第一列告诉一个文件的状态或它的内容,返回代码解释以下:

A item

文件、目录或是符号链item预约加入到版本库。

C item

文件item发生冲突,在从服务器更新时与本地版本发生交迭,在你提交到版本库前,必须手工的解决冲突。

D item

文件、目录或是符号链item预约从版本库中删除。

M item

文件item的内容被修改了。

R item

文件、目录或是符号链item预约将要替换版本库中的item,这意味着这个对象首先要被删除,另一个同名的对象将要被添加,全部的操做发生在一个修订版本。

X item

目录没有版本化,可是与Subversion的外部定义关联,关于外部定义,能够看“外部定义”一节

? item

文件、目录或是符号链item不在版本控制之下,你能够经过使用svn status--quiet-q)参数或父目录的svn:ignore属性忽略这个问题,关于忽略文件的使用,见svn:ignore”一节

! item

文件、目录或是符号链item在版本控制之下,可是已经丢失或者不完整,这可能由于使用非Subversion命令删除形成的,若是是一个目录,有多是检出或是更新时的中断形成的,使用svn update能够从新从版本库得到文件或者目录,也能够使用svn revert file恢复原来的文件。

~ item

文件、目录或是符号链item在版本库已经存在,但你的工做拷贝中的是另外一个。举一个例子,你删除了一个版本库的文件,新建了一个在原来的位置,并且整个过程当中没有使用svn delete或是svn add

I item

文件、目录或是符号链item不在版本控制下,Subversion已经配置好了会在svn addsvn importsvn status命令忽略这个文件,关于忽略文件,见svn:ignore”一节。注意,这个符号只会在使用svn status的参数--no-ignore时才会出现—不然这个文件会被忽略且不会显示!

第二列说明文件或目录的属性的状态(更多细节能够看“属性”一节),若是一个M出如今第二列,说明属性被修改了,不然显示空白。

第三列只显示空白或者LL表示Subversion已经锁定了这个目录的工做区域.svn,当你的svn commit正在运行的时候—也许正在输入log信息,运行svn status你能够看到L标记,若是这时候Subversion并无运行,能够推测Subversion发生中断而且已经锁定,你必须运行svn cleanup来清除锁定(本节后面将有更多论述)。

第四列只会显示空白或++的意思是一个有附加历史信息的文件或目录预约添加或者修改到版本库,一般出如今svn move或是svn copy时,若是是看到A  +就是说要包含历史的增长,它能够是一个文件或是拷贝的根目录。+表示它是即将包含历史增长到版本库的目录的一部分,也就是说他的父目录要拷贝,它只是跟着一块儿的。 M  +表示将要包含历史的增长,而且已经更改了。当你提交时,首先会随父目录进行包含历史的增长,而后本地的修改提交到更改后的版本。

第五列只显示空白或是S,表示这个目录或文件已经转到了一个分支下了(使用svn switch)。

第六列显示了锁定的信息,将会在“锁定”一节详细说明。

若是你传递一个路径给svn status,它只给你这个项目的信息:

$ svn status stuff/fish.c
D stuff/fish.c

svn status也有一个--verbose-v)选项,它能够显示工做拷贝中的全部项目,即便没有改变过:

$ svn status --verbose
M 44 23 sally README
44 30 sally INSTALL
M 44 20 harry bar.c
44 18 ira stuff
44 35 harry stuff/trout.c
D 44 19 ira stuff/fish.c
44 21 sally stuff/things
A 0 ? ? stuff/things/bloo.h
44 36 harry stuff/things/gloo.c

这是svn status的“加长形式”,第一列保持相同,第二列显示一个工做版本号,第三和第四列显示最后一次修改的版本号和修改人。

上面全部的svn status调用并无联系版本库,只是与.svn中的元数据进行比较的结果,最后,是--show-updates-u)参数,它将会联系版本库为已通过时的数据添加新信息:

$ svn status --show-updates --verbose
M * 44 23 sally README
M 44 20 harry bar.c
* 44 35 harry stuff/trout.c
D 44 19 ira stuff/fish.c
A 0 ? ? stuff/things/bloo.h
Status against revision: 46

注意这两个星号:若是你如今执行svn update,你的READMEtrout.c会被更新,这告诉你许多有用的信息—你能够在提交以前,须要使用更新操做获得文件README的更新,或者说文件已通过时,版本库会拒绝了你的提交。(后面还有更多关于此主题)。

另外一种检查修改的方式是svn diff命令,你能够经过不带参数的svn diff精确的找出你所作的修改,这会输出统一区别格式:[4]

$ svn diff
Index: bar.c
===================================================================
--- bar.c (revision 3)
+++ bar.c (working copy)
@@ -1,7 +1,12 @@
+#include <sys/types.h>
+#include <sys/stat.h>
+#include <unistd.h>
+
+#include <stdio.h>

int main(void) {
- printf("Sixty-four slices of American Cheese.../n");
+ printf("Sixty-five slices of American Cheese.../n");
return 0;
}

Index: README
===================================================================
--- README (revision 3)
+++ README (working copy)
@@ -193,3 +193,4 @@
+Note to self: pick up laundry.

Index: stuff/fish.c
===================================================================
--- stuff/fish.c (revision 1)
+++ stuff/fish.c (working copy)
-Welcome to the file known as 'fish'.
-Information on fish will be here soon.

Index: stuff/things/bloo.h
===================================================================
--- stuff/things/bloo.h (revision 8)
+++ stuff/things/bloo.h (working copy)
+Here is a new file to describe
+things about bloo.

svn diff命令经过比较你的文件和.svn的“原始”文件来输出信息,预约要增长的文件会显示全部增长的文本,要删除的文件会显示全部要删除的文本。

输出的格式为统一区别格式(unified diff format),删除的行前面加一个-,添加的行前面有一个+svn diff命令也打印文件名和打补丁须要的信息,因此你能够经过重定向一个区别文件来生成“补丁”:

$ svn diff > patchfile

举个例子,你能够把补丁文件发送邮件到其余开发者,在提交以前审核和测试。

咱们能够使用svn status -u来预测冲突,当你运行svn update一些有趣的事情发生了:

$ svn update
U INSTALL
G README
C bar.c
Updated to revision 46.

UG不必关心,文件干净的接受了版本库的变化,文件标示为U代表本地没有修改,文件已经根据版本库更新。G标示合并,标示本地已经修改过,与版本库没有重迭的地方,已经合并。

可是C表示冲突,说明服务器上的改动同你的改动冲突了,你须要本身手工去解决。

当冲突发生了,有三件事能够帮助你注意到这种状况和解决问题:

举一个例子,Sally修改了sandwich.txt,Harry刚刚改变了他的本地拷贝中的这个文件而且提交到服务器,Sally在提交以前更新它的工做拷贝获得了冲突:

$ svn update
C sandwich.txt
Updated to revision 2.
$ ls -1
sandwich.txt
sandwich.txt.mine
sandwich.txt.r1
sandwich.txt.r2

在这种状况下,Subversion会容许你提交sandwich.txt,直到你的三个临时文件被删掉。

$ svn commit --message "Add a few more things"
svn: Commit failed (details follow):
svn: Aborting commit: '/home/sally/svn-work/sandwich.txt' remains in conflict

若是你遇到冲突,三件事你能够选择:

  • 手动”合并冲突文本(检查和修改文件中的冲突标志)。

  • 用某一个临时文件覆盖你的工做文件。

  • 运行svn revert <filename>来放弃全部的修改。

一旦你解决了冲突,你须要经过命令svn resolved让Subversion知道,这样就会删除三个临时文件,Subversion就不会认为这个文件是在冲突状态了。[5]

$ svn resolved sandwich.txt
Resolved conflicted state of 'sandwich.txt'

第一次尝试解决冲突让人感受很惧怕,但通过一点训练,它简单的像是骑着车子下坡。

这里一个简单的例子,因为不良的交流,你和同事Sally,同时编辑了sandwich.txt。Sally提交了修改,当你准备更新你的版本,冲突发生了,咱们不得不去修改sandwich.txt来解决这个问题。首先,看一下这个文件:

$ cat sandwich.txt
Top piece of bread
Mayonnaise
Lettuce
Tomato
Provolone
<<<<<<< .mine
Salami
Mortadella
Prosciutto
=======
Sauerkraut
Grilled Chicken
>>>>>>> .r2
Creole Mustard
Bottom piece of bread

小于号、等于号和大于号串是冲突标记,并非冲突的数据,你必定要肯定这些内容在下次提交以前获得删除,前两组标志中间的内容是你在冲突区所作的修改:

<<<<<<< .mine
Salami
Mortadella
Prosciutto
=======

后两组之间的是Sally提交的修改冲突:

=======
Sauerkraut
Grilled Chicken
>>>>>>> .r2

一般你并不但愿只是删除冲突标志和Sally的修改—当她收到三明治时,会很是的吃惊。因此你应该走到她的办公室或是拿起电话告诉Sally,你没办法从从意大利熟食店获得想要的泡菜。[6]一旦大家确认了提交内容后,修改文件而且删除冲突标志。

Top piece of bread
Mayonnaise
Lettuce
Tomato
Provolone
Salami
Mortadella
Prosciutto
Creole Mustard
Bottom piece of bread

如今运行svn resolved,你已经准备好提交了:

$ svn resolved sandwich.txt
$ svn commit -m "Go ahead and use my sandwich, discarding Sally's edits."

记住,若是你修改冲突时感到混乱,你能够参考subversion生成的三个文件—包括你未做更新的文件。你也能够使用第三方的合并工具检验这三个文件。

最后!你的修改结束了,你合并了服务器上全部的修改,你准备好提交修改到版本库。

svn commit命令发送全部的修改到版本库,当你提交修改时,你须要提供一些描述修改的日志信息,你的信息会附到这个修订版本上,若是信息很简短,你能够在命令行中使用--message-m)选项:

$ svn commit --message "Corrected number of cheese slices."
Sending sandwich.txt
Transmitting file data .
Committed revision 3.

然而,若是你把写日志信息看成工做的一部分,你也许会但愿经过告诉Subversion一个文件名获得日志信息,使用--file选项:

$ svn commit --file logmsg 
Sending sandwich.txt
Transmitting file data .
Committed revision 4.

若是你没有指定--message或者--file选项,Subversion会自动地启动你最喜欢的编辑器(见“config”一节editor-cmd部分)来编辑日志信息。

提示

若是你使用编辑器撰写日志信息时但愿取消提交,你能够直接关掉编辑器,不要保存,若是你已经作过保存,只要简单的删掉全部的文本并再次保存。

$ svn commit
Waiting for Emacs...Done

Log message unchanged or not specified
a)bort, c)ontinue, e)dit
a
$

版本库不知道也不关心你的修改做为一个总体是否有意义,它只检查是否有其余人修改了同一个文件,若是别人已经这样作了,你的整个提交会失败,而且提示你一个或多个文件已通过时了:

$ svn commit --message "Add another rule"
Sending rules.txt
svn: Commit failed (details follow):
svn: Out of date: 'rules.txt' in transaction 'g'

此刻,你须要运行svn update来处理全部的合并和冲突,而后再尝试提交。

咱们已经覆盖了Subversion基本的工做周期,还有许多其它特性能够管理你得版本库和工做拷贝,可是只使用前面介绍的命令你就能够很轻松的工做了。

咱们曾经说过,版本库就像是一台时间机器,它记录了全部提交的修改,容许你检查文件或目录以及相关元数据的历史。经过一个Subversion命令你能够根据时间或修订号取出一个过去的版本(或者恢复如今的工做拷贝),然而,有时候咱们只是想看看历史而不想回到历史。

有许多命令能够为你提供版本库历史:

找出一个文件或目录的历史信息,使用svn log命令,svn log将会提供你一条记录,包括:谁对文件或目录做了修改、哪一个修订版本做了修改、修订版本的日期和时间、还有若是你当时提供了日志信息,也会显示。

$ svn log
------------------------------------------------------------------------
r3 | sally | Mon, 15 Jul 2002 18:03:46 -0500 | 1 line

Added include lines and corrected # of cheese slices.
------------------------------------------------------------------------
r2 | harry | Mon, 15 Jul 2002 17:47:57 -0500 | 1 line

Added main() methods.
------------------------------------------------------------------------
r1 | sally | Mon, 15 Jul 2002 17:40:08 -0500 | 1 line

Initial import
------------------------------------------------------------------------

注意日志信息缺省根据时间逆序排列,若是但愿察看特定顺序的一段修订版本或者单一版本,使用--revision-r)选项:

$ svn log --revision 5:19    # shows logs 5 through 19 in chronological order

$ svn log -r 19:5 # shows logs 5 through 19 in reverse order

$ svn log -r 8 # shows log for revision 8

你也能够检查单个文件或目录的日志历史,举个例子:

$ svn log foo.c

$ svn log http://foo.com/svn/trunk/code/foo.c

这样只会显示这个工做文件(或者URL)作过修订的版本的日志信息。

若是你但愿获得目录和文件更多的信息,你能够对svn log命令使用--verbose-v)开关,由于Subversion容许移动和复制文件和目录,因此跟踪路径修改很是重要,在详细模式下,svn log 输出中会包括一个路径修改的历史:

$ svn log -r 8 -v
------------------------------------------------------------------------
r8 | sally | 2002-07-14 08:15:29 -0500 | 1 line
Changed paths:
M /trunk/code/foo.c
M /trunk/code/bar.h
A /trunk/code/doc/README

Frozzled the sub-space winch.

------------------------------------------------------------------------

svn log也有一个--quiet (-q)选项,会禁止日志信息的主要部分,当与--verbose结合使用,仅会显示修改的文件名。

咱们已经看过svn diff—使用标准区别文件格式显示区别,它在提交前用来显示本地工做拷贝与版本库的区别。

事实上,svn diff种不一样的用法:

除了以上的命令,你能够使用带参数--revisionsvn updatesvn checkout来使整个工做拷贝“回到过去[7]

$ svn checkout --revision 1729 # Checks out a new working copy at r1729

$ svn update --revision 1729 # Updates an existing working copy to r1729

不象这章前面讨论的那些常常用到的命令,这些命令只是偶尔被用到。

咱们已经覆盖了大多数Subversion的客户端命令,引人注目的例外是处理分支与合并(见第 4 章 分支与合并)以及属性(见“属性”一节)的命令,然而你也许会但愿跳到第 9 章 Subversion彻底参考来察看全部不一样的命令—怎样利用它们使你的工做更容易。



[3] 固然没有任何东西是在版本库里被删除了—只是在版本库的HEAD里消失了,你能够经过检出(或者更新你的工做拷贝)你作出删除操做的前一个修订版原本找回全部的东西。

[4] Subversion使用内置区别引擎,缺省状况下输出为统一区别格式。若是你指望不一样的输出格式,你能够使用--diff-cmd指定外置的区别程序,而且经过--extensions传递其余参数,举个例子,察看本地文件foo.c的区别,同时忽略空格修改,你能够运行svn diff --diff-cmd /usr/bin/diff --extensions '-bc' foo.c

[5] 你也能够手工的删除这三个临时文件,可是当Subversion会给你作时你会本身去作吗?咱们是这样想的。

[6] 若是你向他们询问,他们很是有理由把你带到城外的铁轨上。

[7] 看到了吧?咱们说过Subversion是一个时间机器。

分支、标签和合并是全部版本控制系统的共同概念,若是你并不熟悉这些概念,咱们会在这一章里很好的介绍,若是你很熟悉,很是但愿你有兴趣知道Subversion是怎样实现这些概念的。

分支是版本控制的基础组成部分,若是你容许Subversion来管理你的数据,这个特性将是你所必须依赖的 ,这一章假定你已经熟悉了Subversion的基本概念(第 2 章 基本概念)。

在这一点上,你必须理解每一次提交是怎样创建整个新的文件系统树(叫作“修订版本”)的,若是没有,能够回头去读“修订版本”一节

对于本章节,咱们会回到第2章的同一个例子,还记得你和你的合做者Sally分享一个包含两个项目的版本库,paintcalc。注意图 4.2 “开始规划版本库”,然而,如今每一个项目的都有一个trunkbranches子目录,它们存在的理由很快就会清晰起来。

像之前同样,假定Sally和你都有“calc”项目的一份拷贝,更准确地说,你有一份/calc/trunk的工做拷贝,这个项目的全部的文件在这个子目录里,而不是在/calc下,由于你的小组决定使用/calc/trunk做为开发使用的“主线”。

假定你有一个任务,将要对项目作基本的从新组织,这须要花费大量时间来完成,会影响项目的全部文件,问题是你不会但愿打扰Sally,她正在处理这样或那样的程序小Bug,一直使用整个项目(/calc/trunk)的最新版本,若是你一点一点的提交你的修改,你必定会干扰Sally的工做。

一 种策略是本身闭门造车:你和Sally能够中止一个到两个星期的共享,也就是说,开始做出本质上的修改和从新组织工做拷贝的文件,可是在完成这个任务以前 不作提交和更新。这样会有不少问题,首先,这样并不安全,许多人习惯频繁的保存修改到版本库,工做拷贝必定有许多意外的修改。第二,这样并不灵活,若是你 的工做在不一样的计算机(或许你在不一样的机器有两份/calc/trunk的工做拷贝),你须要手工的来回拷贝修改,或者只在一个计算机上工做,这时很难作到共享你即时的修改,一项软件开发的“最佳实践” 就是容许审核你作过的工做,若是没有人看到你的提交,你失去了潜在的反馈。最后,当你完成了公司主干代码的修改工做,你会发现合并你的工做拷贝和公司的主 干代码会是一件很是困难的事情,Sally(或者其余人)也许已经对版本库作了许多修改,已经很难和你的工做拷贝结合—当你单独工做几周后运行svn update时就会发现这一点。

最佳方案是建立你本身的分支,或者是版本库的开发线。这容许你保存破坏了一半的工做而不打扰别人,尽管你仍能够选择性的同你的合做者分享信息,你将会看到这是怎样工做的。

创建分支很是的简单—使用svn copy命令给你的工程作个拷贝,Subversion不只能够拷贝单个文件,也能够拷贝整个目录,在目前状况下,你但愿做/calc/trunk的拷贝,新的拷贝应该在哪里?在你但愿的任何地方—它只是在于项目的政策,咱们假设大家项目的政策是在/calc/branches创建分支,而且你但愿把你的分支叫作my-calc-branch,你但愿创建一个新的目录/calc/branches/my-calc-branch,做为/calc/trunk的拷贝开始它的生命周期。

有两个方法做拷贝,咱们首先介绍一个混乱的方法,只是让概念更清楚,做为开始,取出一个工程的根目录,/calc

$ svn checkout http://svn.example.com/repos/calc bigwc
A bigwc/trunk/
A bigwc/trunk/Makefile
A bigwc/trunk/integer.c
A bigwc/trunk/button.c
A bigwc/branches/
Checked out revision 340.

创建一个备份只是传递两个目录参数到svn copy命令:

$ cd bigwc
$ svn copy trunk branches/my-calc-branch
$ svn status
A + branches/my-calc-branch

在这个状况下,svn copy命令迭代的将trunk工做目录拷贝到一个新的目录branhes/my-calc-branch,像你从svn status看到的,新的目录是准备添加到版本库的,可是也要注意A后面的“+”号,这代表这个准备添加的东西是一份备份,而不是新的东西。当你提交修改,Subversion会经过拷贝/calc/trunk创建/calc/branches/my-calc-branch目录,而不是经过网络传递全部数据:

$ svn commit -m "Creating a private branch of /calc/trunk."
Adding branches/my-calc-branch
Committed revision 341.

如今,咱们必须告诉你创建分支最简单的方法:svn copy能够直接对两个URL操做。

$ svn copy http://svn.example.com/repos/calc/trunk /
http://svn.example.com/repos/calc/branches/my-calc-branch /
-m "Creating a private branch of /calc/trunk."

Committed revision 341.

其实这两种方法没有什么区别,两个过程都在版本341创建了一个新目录做为/calc/trunk的一个备份,这些能够在图 4.3 “拷贝后的版本库”看到,注意第二种方法,只是执行了一个当即提交。 [8]这是一个简单的过程,由于你不须要取出版本库一个庞大的镜像,事实上,这个技术不须要你有工做拷贝。

如今你已经在项目里创建分支了,你能够取出一个新的工做拷贝来开始使用:

$ svn checkout http://svn.example.com/repos/calc/branches/my-calc-branch
A my-calc-branch/Makefile
A my-calc-branch/integer.c
A my-calc-branch/button.c
Checked out revision 341.

这一份工做拷贝没有什么特别的,它只是版本库另外一个目录的一个镜像罢了,当你提交修改时,Sally在更新时不会看到改变,她是/calc/trunk的工做拷贝。(肯定要读本章后面的“转换工做拷贝”一节svn switch命令是创建分支工做拷贝的另外一个选择。)

咱们假定本周就要过去了,以下的提交发生:

  • 你修改了/calc/branches/my-calc-branch/button.c,生成版本号342。

  • 你修改了/calc/branches/my-calc-branch/integer.c,生成版本号343。

  • Sally修改了/calc/trunk/integer.c,生成了版本号344。

如今有两个独立开发线,图 4.4 “一个文件的分支历史”显示了integer.c的历史。

当你看到integer.c的改变时,你会发现颇有趣:

$ pwd
/home/user/my-calc-branch

$ svn log --verbose integer.c
------------------------------------------------------------------------
r343 | user | 2002-11-07 15:27:56 -0600 (Thu, 07 Nov 2002) | 2 lines
Changed paths:
M /calc/branches/my-calc-branch/integer.c

* integer.c: frozzled the wazjub.

------------------------------------------------------------------------
r341 | user | 2002-11-03 15:27:56 -0600 (Thu, 07 Nov 2002) | 2 lines
Changed paths:
A /calc/branches/my-calc-branch (from /calc/trunk:340)

Creating a private branch of /calc/trunk.

------------------------------------------------------------------------
r303 | sally | 2002-10-29 21:14:35 -0600 (Tue, 29 Oct 2002) | 2 lines
Changed paths:
M /calc/trunk/integer.c

* integer.c: changed a docstring.

------------------------------------------------------------------------
r98 | sally | 2002-02-22 15:35:29 -0600 (Fri, 22 Feb 2002) | 2 lines
Changed paths:
M /calc/trunk/integer.c

* integer.c: adding this file to the project.

------------------------------------------------------------------------

注意,Subversion追踪分支上的integer.c的历史,包括全部的操做,甚至追踪到拷贝以前。这表示了创建分支也是历史中的一次事件,由于在拷贝整个/calc/trunk/时已经拷贝了一份integer.c。如今看Sally在她的工做拷贝运行一样的命令:

$ pwd
/home/sally/calc

$ svn log --verbose integer.c
------------------------------------------------------------------------
r344 | sally | 2002-11-07 15:27:56 -0600 (Thu, 07 Nov 2002) | 2 lines
Changed paths:
M /calc/trunk/integer.c

* integer.c: fix a bunch of spelling errors.

------------------------------------------------------------------------
r303 | sally | 2002-10-29 21:14:35 -0600 (Tue, 29 Oct 2002) | 2 lines
Changed paths:
M /calc/trunk/integer.c

* integer.c: changed a docstring.

------------------------------------------------------------------------
r98 | sally | 2002-02-22 15:35:29 -0600 (Fri, 22 Feb 2002) | 2 lines
Changed paths:
M /calc/trunk/integer.c

* integer.c: adding this file to the project.

------------------------------------------------------------------------

sally看到她本身的344修订,你作的343修改她看不到,从Subversion看来,两次提交只是影响版本库中不一样位置上的两个文件。然而,Subversion显示了两个文件有共同的历史,在分支拷贝以前,他们使用同一个文件,因此你和Sally都看到版本号303到98的修改。

如今你与Sally在同一个项目的并行分支上工做:你在私有分支上,而Sally在主干(trunk)或者叫作开发主线上。

因为有众多的人参与项目,大多数人拥有主干拷贝是很正常的,任何人若是进行一个长周期的修改会使得主干陷入混乱,因此一般的作法是创建一个私有分支,提交修改到本身的分支,直到这阶段工做结束。

因此,好消息就是你和Sally不会互相打扰,坏消息是有时候分离会远。记住“闭门造车”策略的问题,当你完成你的分支后,可能由于太多冲突,已经没法轻易合并你的分支和主干的修改。

相反,在你工做的时候你和Sally仍然能够继续分享修改,这依赖于你决定什么值得分享,Subversion给你在分支间选择性“拷贝”修改的能力,当你完成了分支上的全部工做,全部的分支修改能够被拷贝回到主干。

在上一章节,咱们提到你和Sally对integer.c在 不一样的分支上作过修改,若是你看了Sally的344版本的日志信息,你会知道她修正了一些拼写错误,毋庸置疑,你的拷贝的文件也必定存在这些拼写错误, 因此你之后的对这个文件修改也会保留这些拼写错误,因此你会在未来合并时获得许多冲突。最好是如今接收Sally的修改,而不是做了许多工做以后才来作。

是时间使用svn merge命令,这个命令的结果很是相似svn diff命令(在第3章的内容),两个命令均可以比较版本库中的任何两个对象而且描述其区别,举个例子,你能够使用svn diff来查看Sally在版本344做的修改:

$ svn diff -r 343:344 http://svn.example.com/repos/calc/trunk

Index: integer.c
===================================================================
--- integer.c (revision 343)
+++ integer.c (revision 344)
@@ -147,7 +147,7 @@
case 6: sprintf(info->operating_system, "HPFS (OS/2 or NT)"); break;
case 7: sprintf(info->operating_system, "Macintosh"); break;
case 8: sprintf(info->operating_system, "Z-System"); break;
- case 9: sprintf(info->operating_system, "CPM"); break;
+ case 9: sprintf(info->operating_system, "CP/M"); break;
case 10: sprintf(info->operating_system, "TOPS-20"); break;
case 11: sprintf(info->operating_system, "NTFS (Windows NT)"); break;
case 12: sprintf(info->operating_system, "QDOS"); break;
@@ -164,7 +164,7 @@
low = (unsigned short) read_byte(gzfile); /* read LSB */
high = (unsigned short) read_byte(gzfile); /* read MSB */
high = high << 8; /* interpret MSB correctly */
- total = low + high; /* add them togethe for correct total */
+ total = low + high; /* add them together for correct total */

info->extra_header = (unsigned char *) my_malloc(total);
fread(info->extra_header, total, 1, gzfile);
@@ -241,7 +241,7 @@
Store the offset with ftell() ! */

if ((info->data_offset = ftell(gzfile))== -1) {
- printf("error: ftell() retturned -1./n");
+ printf("error: ftell() returned -1./n");
exit(1);
}

@@ -249,7 +249,7 @@
printf("I believe start of compressed data is %u/n", info->data_offset);
#endif

- /* Set postion eight bytes from the end of the file. */
+ /* Set position eight bytes from the end of the file. */

if (fseek(gzfile, -8, SEEK_END)) {
printf("error: fseek() returned non-zero/n");

svn merge命令几乎彻底相同,但不是打印区别到你的终端,它会直接做为本地修改做用到你的本地拷贝:

$ svn merge -r 343:344 http://svn.example.com/repos/calc/trunk
U integer.c

$ svn status
M integer.c

svn merge的输出告诉你的integer.c文件已经做了补丁(patched),如今已经保留了Sally修改—修改从主干“拷贝”到你的私有分支的工做拷贝,如今做为一个本地修改,在这种状况下,要靠你审查本地的修改来肯定它们工做正常。

在另外一种情境下,事情并不会运行得这样正常,也许integer.c也许会进入冲突状态,你必须使用标准过程(见第三章)来解决这种状态,或者你认为合并是一个错误的决定,你只须要运行svn revert放弃。

可是当你审查过你的合并结果后,你能够使用svn commit提交修改,在那一刻,修改已经合并到你的分支上了,在版本控制术语中,这种在分支之间拷贝修改的行为叫作搬运修改。

当你提交你的修改时,肯定你的日志信息中说明你是从某一版本搬运了修改,举个例子:

$ svn commit -m "integer.c: ported r344 (spelling fixes) from trunk."
Sending integer.c
Transmitting file data .
Committed revision 360.

你将会在下一节看到,这是一条很是重要的“最佳实践”。

一个警告:为何svn diffsvn merge在概念上是很接近,但语法上有许多不一样,必定阅读第9章来查看其细节或者使用svn help查看帮助。举个例子,svn merge须要一个工做拷贝做为目标,就是一个地方来施展目录树修改,若是一个目标都没有指定,它会假定你要作如下某个普通的操做:

  1. 你但愿合并目录修改到工做拷贝的当前目录。

  2. 你但愿合并修改到你的当前工做目录的相同文件名的文件。

若是你合并一个目录而没有指定特定的目标,svn merge假定第一种状况,在你的当前目录应用修改。若是你合并一个文件,而这个文件(或是一个有相同的名字文件)在你的当前工做目录存在,svn merge假定第二种状况,你想对这个同名文件使用合并。

若是你但愿修改应用到别的目录,你须要说出来。举个例子,你在工做拷贝的父目录,你须要指定目标目录:

$ svn merge -r 343:344 http://svn.example.com/repos/calc/trunk my-calc-branch
U my-calc-branch/integer.c

你已经看到了svn merge命 令的例子,你将会看到更多,若是你对合并是如何工做的感到迷惑,这并不奇怪,不少人和你同样。许多新用户(特别是对版本控制很陌生的用户)会对这个命令的 正确语法感到不知所措,不知道怎样和何时使用这个特性,不要惧怕,这个命令实际上比你想象的简单!有一个简单的技巧来帮助你理解svn merge的行为。

迷惑的主要缘由是这个命令的名称,术语“合并”不知什么缘由被用来代表分支的组合,或者是其余什么神奇的数据混合,这不是事实,一个更好的名称应该是svn diff-and-apply,这是发生的全部事件:首先两个版本库树比较,而后将区别应用到本地拷贝。

这个命令包括三个参数:

一旦这三个参数指定之后,两个目录树将要作比较,比较结果将会做为本地修改应用到目标工做拷贝,当命令结束后,结果同你手工修改或者是使用svn addsvn delete没有什么区别,若是你喜欢这结果,你能够提交,若是不喜欢,你能够使用svn revert恢复修改。

svn merge的语法容许很是灵活的指定参数,以下是一些例子:

      
$ svn merge http://svn.example.com/repos/branch1@150 /
http://svn.example.com/repos/branch2@212 /
my-working-copy

$ svn merge -r 100:200 http://svn.example.com/repos/trunk my-working-copy

$ svn merge -r 100:200 http://svn.example.com/repos/trunk

第一种语法使用URL@REV的形式直接列出了全部参数,第二种语法能够用来做为比较同一个URL的不一样版本的简略写法,最后一种语法表示工做拷贝是可选的,若是省略,默认是当前目录。

就像svn update命令,svn merge会把修改应用到工做拷贝,所以它也会形成冲突,由于svn merge形成的冲突有时候会有些不一样,本小节会解释这些区别。

做为开始,咱们假定本地没有修改,当你svn update到一个特定修订版本时,修改会“干净的”应用到工做拷贝,服务器产生比较两树的增量数据:一个工做拷贝和你关注的版本树的虚拟快照,由于比较的左边同你拥有的彻底相同,增量数据确保你把工做拷贝转化到右边的树。

可是svn merge没有这样的保证,会致使不少的混乱:用户能够询问服务器比较任何两个树,即便一个与工做拷贝绝不相关的!这意味着有潜在的人为错误,用户有时候会比较两个错误的树,建立的增量数据不会干净的应用,svn merge会尽力应用更多的增量数据,可是有一些部分也许会难以完成,就像Unix下patch命令有时候会报告“failed hunks”错误,svn merge会报告“skipped targets”:

$ svn merge -r 1288:1351 http://svn.example.com/repos/branch
U foo.c
U bar.c
Skipped missing target: 'baz.c'
U glub.c
C glorb.h

$

在前一个例子中,baz.c也许会存在于比较的两个分支快照里,但工做拷贝里不存在,比较的增量数据要应用到这个文件,这种状况下会发生什么?“skipped”信息意味着用户多是在比较错误的两棵树,这是经典的驱动器错误,当发生这种状况,能够使用迭代恢复(svn revert --recursive)合并所做的修改,删除恢复后留下的全部未版本化的文件和目录,而且使用另外的参数运行svn merge

也应当注意前一个例子显示glorb.h发生了冲突,咱们已经规定本地拷贝没有修改:冲突怎么会发生呢?由于用户能够使用svn merge将过去的任何变化应用到当前工做拷贝,变化包含的文本修改也许并不能干净的应用到工做拷贝文件,即便这些文件没有本地修改。

另外一个svn updatesvn merge的小区别是冲突产生的文件的名字不一样,在“解决冲突(合并别人的修改)”一节,咱们看到过更新产生的文件名字为filename.minefilename.rOLDREVfilename.rNEWREV,当svn merge产生冲突时,它产生的三个文件分别为 filename.workingfilename.leftfilename.right。在这种状况下,术语“left”和“right”表示了两棵树比较时的两边,在两种状况下,不一样的名字会帮助你区分冲突是由于更新形成的仍是合并形成的。

当与Subversion开发者交谈时你必定会听到说起术语祖先,这个词是用来描述两个对象的关系:若是他们互相关联,一个对象就是另外一个的祖先,或者相反。

举个例子,假设你提交版本100,包括对foo.c的修改,则foo.c@99是foo.c@100的一个“祖先”,另外一方面,假设你在版本101删除这个文件,而在102版本提交一个同名的文件,在这个状况下,foo.c@99foo.c@102看起来是关联的(有一样的路径),可是事实上他们是彻底不一样的对象,它们并不共享同一个历史或者说“祖先”。

指出svn diffsvn merge区别的重要性在于,前一个命令忽略祖先,若是你询问svn diff来比较文件foo.c的版本99和102,你会看到行为基础的区别,diff命令只是盲目的比较两条路径,可是若是你使用svn merge是比较一样的两个对象,它会注意到他们是不关联的,并且首先尝试删除旧文件,而后添加新文件,输出会是一个删除紧接着一个增长:

D  foo.c
A foo.c

大多数合并包括比较包括祖先关联的两条树,所以svn merge这样运做,然而,你也许会但愿merge命令可以比较两个不相关的目录树,举个例子,你有两个目录树分别表明了卖主软件项目的不一样版本(见“卖主分支”一节),若是你使用svn merge进行比较,你会看到第一个目录树被删除,而第二个树添加上!

在这个状况下,你只是但愿svn merge可以作一个以路径为基础的比较,忽略全部文件和目录的关系,增长--ignore-ancestry选项会致使命令象svn diff同样。(相应的,--notice-ancestry选项会使svn diffmerge命令同样行事。)

分支和svn merge有不少不一样的用法,这个小节描述了最多见的用法。

为了完成这个例子,咱们将时间往前推动,假定已通过了几天,在主干和你的分支上都有许多更改,假定你完成了分支上的工做,已经完成了特性或bug修正,你想合并全部分支的修改到主干上,让别人也能够使用。

这种状况下如何使用svn merge?记住这个命令比较两个目录树,而后应用比较结果到工做拷贝,因此要接受这种变化,你须要主干的工做拷贝,咱们假设你有一个最初的主干工做拷贝(彻底更新),或者是你最近取出了/calc/trunk的一个干净的工做拷贝。

可是要哪两个树进行比较呢?乍一看,回答很明确,只要比较最新的主干与分支。可是你要意识到—这个想法是错误的,伤害了许多新用户!由于svn merge的操做很像svn diff,比较最新的主干和分支树不只仅会描述你在分支上所做的修改,这样的比较会展现太多的不一样,不只包括分支上的增长,也包括了主干上的删除操做,而这些删除根本就没有在分支上发生过。

为了表示你的分支上的修改,你只须要比较分支的初始状态与最终状态,在你的分支上使用svn log命令,你能够看到你的分支在341版本创建,你的分支最终的状态用HEAD版本表示,这意味着你但愿可以比较版本341和HEAD的分支目录,而后应用这些分支的修改到主干目录的工做拷贝。

以下是最终的合并过程,而后:

$ cd calc/trunk
$ svn update
At revision 405.

$ svn merge -r 341:405 http://svn.example.com/repos/calc/branches/my-calc-branch
U integer.c
U button.c
U Makefile

$ svn status
M integer.c
M button.c
M Makefile

# ...examine the diffs, compile, test, etc...

$ svn commit -m "Merged my-calc-branch changes r341:405 into the trunk."
Sending integer.c
Sending button.c
Sending Makefile
Transmitting file data ...
Committed revision 406.

再次说明,日志信息中详细描述了合并到主干的的修改范围,记住必定要这么作,这是你之后须要的重要信息。

举个例子,你但愿在分支上继续工做一周,来进一步增强你的修正,这时版本库的HEAD版本是480,你准备好了另外一次合并,可是咱们在“合并的最佳实践”一节提到过,你不想合并已经合并的内容,你只想合并新的东西,技巧就是指出什么是“”的。

第一步是在主干上运行svn log察看最后一次与分支合并的日志信息:

$ cd calc/trunk
$ svn log

------------------------------------------------------------------------
r406 | user | 2004-02-08 11:17:26 -0600 (Sun, 08 Feb 2004) | 1 line

Merged my-calc-branch changes r341:405 into the trunk.
------------------------------------------------------------------------

阿哈!由于分支上341到405之间的全部修改已经在版本406合并了,如今你只须要合并分支在此以后的修改—经过比较406和HEAD

$ cd calc/trunk
$ svn update
At revision 480.

# We notice that HEAD is currently 480, so we use it to do the merge:

$ svn merge -r 406:480 http://svn.example.com/repos/calc/branches/my-calc-branch
U integer.c
U button.c
U Makefile

$ svn commit -m "Merged my-calc-branch changes r406:480 into the trunk."
Sending integer.c
Sending button.c
Sending Makefile
Transmitting file data ...
Committed revision 481.

如今主干有了分支上第二波修改的彻底结果,此刻,你能够删除你的分支(咱们会在之后讨论),或是继续在你分支上工做,重复这个步骤。

svn merge另外一个经常使用的作法是取消已经作得提交,假设你愉快的在/calc/trunk工做,你发现303版本对integer.c的修改彻底错了,它不该该被提交,你能够使用svn merge来“取消”这个工做拷贝上所做的操做,而后提交本地修改到版本库,你要作得只是指定一个相反的区别:

$ svn merge -r 303:302 http://svn.example.com/repos/calc/trunk
U integer.c

$ svn status
M integer.c

$ svn diff

# verify that the change is removed


$ svn commit -m "Undoing change committed in r303."
Sending integer.c
Transmitting file data .
Committed revision 350.

咱们能够把版本库修订版本想象成一组修改(一些版本控制系统叫作修改集),经过-r选项,你能够告诉svn merge来应用修改集或是一个修改集范围到你的工做拷贝,在咱们的状况例子里,咱们使用svn merge合并修改集#303到工做拷贝。

记住回滚修改和任何一个svn merge命令都同样,因此你应该使用svn status或是svn diff来肯定你的工做处于指望的状态中,而后使用svn commit来提交,提交以后,这个特定修改集不会反映到HEAD版本了。

继续,你也许会想:好吧,这不是真的取消提交吧!是吧?版本303还依然存在着修改,若是任何人取出calc的303-349版本,他还会获得错误的修改,对吧?

是的,这是对的。当咱们说“删除”一个修改时,咱们只是说从HEAD删除,原始的修改还保存在版本库历史中,在多数状况下,这是足够好的。大多数人只是对追踪HEAD版 本感兴趣,在一些特定状况下,你也许但愿毁掉全部提交的证据(或许某我的提交了一个秘密文件),这不是很容易的,由于Subversion设计用来不丢失 任何信息,每一个修订版本都是不可变的目录树 ,从历史删除一个版本会致使多米诺效应,会在后面的版本致使混乱甚至会影响全部的工做拷贝。 [10]

版本控制系统很是重要的一个特性就是它的信息从不丢失,即便当你删除了文件或目录,它也许从HEAD版本消失了 ,但这个对象依然存在于历史的早期版本 ,一个新手常常问到的问题是“怎样找回个人文件和目录?

第一步首先要知道须要拯救的项目是什么,这里有个颇有用的比喻:你能够认为任何存在于版本库的对象生活在一个二维的坐标系统里,第一维是一个特定的版本树,第二维是在树中的路径,因此你的文件或目录的任何版本能够有这样一对坐标定义。

Subversion没有向CVS同样的古典目录, [11] 因此你须要svn log来察看你须要找回的坐标对,一个好的策略是使用svn log --verbose来察看你删除的项目,--verbose选项显示全部改变的项目的每个版本 ,你只须要找出你删除文件或目录的那一个版本。你能够经过目测找出这个版本,也能够使用另外一种工具来检查日志的输出 (经过grep或是在编辑器里增量查找)。

$ cd parent-dir
$ svn log --verbose

------------------------------------------------------------------------
r808 | joe | 2003-12-26 14:29:40 -0600 (Fri, 26 Dec 2003) | 3 lines
Changed paths:
D /calc/trunk/real.c
M /calc/trunk/integer.c

Added fast fourier transform functions to integer.c.
Removed real.c because code now in double.c.

在这个例子里,你能够假定你正在找已经删除了的文件real.c,经过查找父目录的历史 ,你知道这个文件在808版本被删除,因此存在这个对象的版本在此以前 。结论:你想从版本807找回/calc/trunk/real.c

以上是最重要的部分—从新找到你须要恢复的对象。如今你已经知道该恢复的文件,而你有两种选择。

一种是对版本反向使用svn merge到808(咱们已经学会了如何取消修改,见“取消修改”一节),这样会从新添加real.c,这个文件会列入增长的计划,通过一次提交,这个文件从新回到HEAD

在这个例子里,这不是一个好的策略,这样作不只把real.c加入添加到计划,也取消了对integer.c的修改,而这不是你指望的。确实,你能够恢复到版本808,而后对integer.c执行取消svn revert操做,但这样的操做没法扩大使用,由于若是从版本808修改了90个文件怎么办?

因此第二个方法不是使用svn merge,而是使用svn copy命令,精确的拷贝版本和路径“坐标对”到你的工做拷贝:

$ svn copy --revision 807 /
http://svn.example.com/repos/calc/trunk/real.c ./real.c

$ svn status
A + real.c

$ svn commit -m "Resurrected real.c from revision 807, /calc/trunk/real.c."
Adding real.c
Transmitting file data .
Committed revision 1390.

加号标志代表这个项目不只仅是计划增长中,并且还包含了历史,Subversion记住了它是从哪一个拷贝过来的。在未来,对这个文件运行svn log会看到这个文件在版本807以前的历史,换句话说,real.c不是新的,而是原先删除的那一个的后代。

尽管咱们的例子告诉咱们如何找回文件,对于恢复删除的目录也是同样的。

版 本控制在软件开发中普遍使用,这里是团队里程序员最经常使用的两种分支/合并模式的介绍,若是你不是使用Subversion软件开发,可随意跳过本小节,如 果你是第一次使用版本控制的软件开发者,请更加注意,如下模式被许多老兵看成最佳实践,这个过程并不仅是针对Subversion,在任何版本控制系统中 都同样,可是在这里使用Subversion术语会感受更方便一点。

大 多数软件存在这样一个生命周期:编码、测试、发布,而后重复。这样有两个问题,第一,开发者须要在质量保证小组测试假定稳定版本时继续开发新特性,新工做 在软件测试时不能够中断,第二,小组必须一直支持老的发布版本和软件;若是一个bug在最新的代码中发现,它必定也存在已发布的版本中,客户但愿马上获得 错误修正而没必要等到新版本发布。

这是版本控制能够作的帮助,典型的过程以下:

整个过程随着软件的成熟不断重复:当2.0完成,一个新的2.0分支被建立,测试、打标签和最终发布,通过许多年,版本库结束了许多版本发布,进入了“维护”模式,许多标签表明了最终的发布版本。

一个特性分支是本章中那个重要例子中的分支,你正在那个分支上工做,而Sally还在/trunk继续工做,这是一个临时分支,用来做复杂的修改而不会干扰/trunk的稳定性,不象发布分支(也许要永远支持),特性分支出生,使用了一段时间,合并到主干,而后最终被删除掉,它们在有限的时间里有用。

还有,关因而否建立特性分支的项目政策也变化普遍,一些项目永远不使用特性分支:你们均可以提交到/trunk,好处是系统的简单—没有人须要知道分支和合并,坏处是主干会常常不稳定或者不可用,另一些项目使用分支达到极限:没有修改曾经直接提交到主干,即便最细小的修改都要建立短暂的分支,而后当心的审核合并到主干,而后删除分支,这样系统保持主干一直稳定和可用,可是形成了巨大的负担。

许多项目采用折中的方式,坚持每次编译/trunk并进行回归测试,只有须要屡次不稳定提交时才须要一个特性分支,这个规则能够用这样一个问题检验:若是开发者在好几天里独立工做,一次提交大量修改(这样/trunk就不会不稳定。),是否会有太多的修改要来回顾?若是答案是“”,这些修改应该在特性分支上进行,由于开发者增量的提交修改,你能够容易的回头检查。

最终,有一个问题就是怎样保持一个特性分支“同步”于工做中的主干,在前面提到过,在一个分支上工做数周或几个月是颇有风险的,主干的修改也许会持续涌入,由于这一点,两条线的开发会区别巨大,合并分支回到主干会成为一个噩梦。

这种状况最好经过有规律的将主干合并到分支来避免,制定这样一个政策:每周将上周的修改合并到分支,注意这样作时须要当心,须要手工记录合并的过程,以免重复的合并(在“手工追踪合并”一节描述过),你须要当心的撰写合并的日志信息,精确的描述合并包括的范围(在“合并一条分支到另外一支”一节中描述过),这看起来像是胁迫,但是其实是容易作到的。

在一些时候,你已经准备好了将“同步的”特性分支合并回到主干,为此,开始作一次将主干最新修改和分支的最终合并,这样之后,除了你的分支修改的部分,最新的分支和主干将会绝对一致,因此在这个特别的例子里,你会经过直接比较分支和主干来进行合并:

$ cd trunk-working-copy

$ svn update
At revision 1910.

$ svn merge http://svn.example.com/repos/calc/trunk@1910 /
http://svn.example.com/repos/calc/branches/mybranch@1910
U real.c
U integer.c
A newdirectory
A newdirectory/newfile

经过比较HEAD修订版本的主干和HEAD修订版本的分支,你肯定了只在分支上的增量信息,两条开发线都有了分枝的修改。

能够用另外一种考虑这种模式,你每周按时同步分支到主干,相似于在工做拷贝执行svn update的命令,最终的合并操做相似于在工做拷贝运行svn commit,毕竟,工做拷贝不就是一个很是浅的分支吗?只是它一次只能够保存一个修改。

svn switch命令改变存在的工做拷贝到另外一个分支,然而这个命令在分支上工做时不是严格必要的,它只是提供了一个快捷方式。在前面的例子里,完成了私有分支的创建,你取出了新目录的工做拷贝,相反,你能够简单的告诉Subversion改变你的/calc/trunk的工做拷贝到分支的路径:

$ cd calc

$ svn info | grep URL
URL: http://svn.example.com/repos/calc/trunk

$ svn switch http://svn.example.com/repos/calc/branches/my-calc-branch
U integer.c
U button.c
U Makefile
Updated to revision 341.

$ svn info | grep URL
URL: http://svn.example.com/repos/calc/branches/my-calc-branch

完成了到分支的“跳转”,你的目录与直接取出一个干净的版本没有什么不一样。这样会更有效率,由于分支只有很小的区别,服务器只是发送修改的部分来使你的工做拷贝反映分支。

svn switch命令也能够带--revision-r)参数,因此你不须要一直移动你的工做拷贝到最新版本。

固然,许多项目比咱们的calc要复杂的多,有更多的子目录,Subversion用户一般用以下的法则使用分支:

换句话说,若是一个用户知道分支工做只发生在部分子目录,咱们使用svn switch来跳转部分目录(有时候只是单个文件),这样的话,他们依然能够继续获得普通的“trunk”主干的更新,可是已经跳转的部分则被免去了更新(除非分支上有更新)。这个特性给“混合工做拷贝”概念添加了新的维度—不只工做拷贝的版本能够混合,在版本库中的位置也能够混合。

若是你的工做拷贝包含许多来自不一样版本库目录跳转的子树,它会工做如常。当你更新时,你会获得每个目录适当的补丁,当你提交时,你的本地修改会一直做为一个单独的原子修改提交到版本库。

注意,由于你的工做拷贝能够在混合位置的状况下工做正常,可是全部的位置必须在同一个版本库,Subversion的版本库不能互相通讯,这个特性还不在Subversion 1.0的计划里。[12]

由于svn switchsvn update的一个变种,具备相同的行为,当新的数据到达时,任何工做拷贝的已经完成的本地修改会被保存,这里容许你做各类聪明的把戏。

举个例子,你的工做拷贝目录是/calc/trunk,你已经作了不少修改,而后你忽然发现应该在分支上修改更好,没问题!你能够使用svn switch,而你本地修改还会保留,你能够测试并提交它们到分支。

另外一个常见的版本控制系统概念是标­¾(tag),一个标签只是一个项目某一时间的“快照”,在Subversion里这个概念无处不在—每一次提交的修订版本都是一个精确的快照。

然而人们但愿更人性化的标签名称,像release-1.0。他们也但愿能够对一个子目录快照,毕竟,记住release-1.0是修订版本4822的某一小部分不是件很容易的事。

svn copy再次登场,你但愿创建一个/calc/trunk的一个快照,就像HEAD修订版本,创建这样一个拷贝:

$ svn copy http://svn.example.com/repos/calc/trunk /
http://svn.example.com/repos/calc/tags/release-1.0 /
-m "Tagging the 1.0 release of the 'calc' project."

Committed revision 351.

这个例子假定/calc/tags目录已经存在(若是不是,见svn mkdir),拷贝完成以后,一个表示当时HEAD版本的/calc/trunk目录的镜像已经永久的拷贝到release-1.0目录。固然,你会但愿更精确一点,以防其余人在你不注意的时候提交修改,因此,若是你知道/calc/trunk的版本350是你想要的快照,你能够使用svn copy加参数 -r 350

可是等一下:标签的产生过程与创建分支是同样的?是的,实际上在Subversion中标签与分支没有区别,都是普通的目录,经过copy命令获得,与分支同样,一个目录之因此是标签只是人们决定这样使用它,只要没有人提交这个目录,它永远是一个快照,但若是人们开始提交,它就变成了分支。

若是你管理一个版本库,你有两种方式管理标签,第一种方法是禁止命令:做为项目的政策,咱们要决定标签所在的位置,肯定全部用户知道如何处理拷贝的目录(也就是确保他们不会提交他们),第二种方法看来很过度:使用访问控制脚原本阻止任何想对标签目录作的非拷贝的操做(见第 6 章 配置服务器)这种方法一般是没必要要的,若是一我的不当心提交了到标签目录一个修改,你能够简单的取消,毕竟这是版本控制啊。

有时候你但愿你的“快照”可以很复杂,而不仅是一个单独修订版本的一个单独目录。

举个例子,假定你的项目比咱们的的例子calc大的多:假设它保存了一组子目录和许多文件,在你工做时,你或许决定建立一个包括特定特性和Bug修正的工做拷贝,你能够经过选择性的回溯文件和目录到特定修订版本(使用svn update -r)来实现,或者转换文件和目录到特定分支(使用svn switch),这样作以后,你的工做拷贝成为版本库不一样版本和分支的司令部,可是通过测试,你会知道这是你须要的一种精确数据组合。

是时候进行快照了,拷贝URL在这里不能工做,在这个例子里,你但愿把本地拷贝的布局作镜像而且保存到版本库中,幸运的是,svn copy包括四种不一样的使用方式(在第9章能够详细阅读),包括拷贝工做拷贝到版本库:

$ ls
my-working-copy/

$ svn copy my-working-copy http://svn.example.com/repos/calc/tags/mytag

Committed revision 352.

如今在版本库有一个新的目录/calc/tags/mytag,这是你的本地拷贝的一个快照—混合了修订版本,URL等等。

一些人也发现这一特性一些有趣的使用方式,有些时候本地拷贝有一组本地修改,你但愿你的协做者看到这些,不使用svn diff并发送一个补定文件(不会捕捉到目录、符号链和属性的修改),而是使用svn copy来“上传”你的工做拷贝到一个版本库的私有区域,你的协做者能够选择完整的取出你的工做拷贝,或使用svn merge来接受你的精确修改。

你必定注意到了Subversion极度的灵活性,由于它用相同的底层机制(目录拷贝)实现了分支和标签,由于分支和标签是做为普通的文件系统出现,会让人们感到惧怕,由于它灵活了,在这个小节里,咱们会提供安排和管理数据的一些建议。

有一些标准的,推荐的组织版本库的方式,许多人建立一个trunk目录来保存开发的“主线”,一个branches目录存放分支拷贝,一个目录保存标签拷贝,若是一个版本库只是存放一个项目,人们会在顶级目录建立这些目录:

/trunk
/branches
/tags

若是一个版本库保存了多个项目,管理员会经过项目来布局(见“选择一种版本库布局”一节关于“项目根目录”):

/paint/trunk
/paint/branches
/paint/tags
/calc/trunk
/calc/branches
/calc/tags

固然,你能够自由的忽略这些一般的布局方式,你能够建立任意的变化,只要是对你和你的项目有益,记住不管你选择什么,这不会是一种永久的承诺,你能够随时从新组织你的版本库。由于分支和标签都是普通的目录,svn move命令能够任意的更名和移动它们,从一种布局到另外一种大概只是一系列服务器端的移动,若是你不喜欢版本库的组织方式,你能够任意修改目录结构。

记住,尽管移动目录很是容易,你必须体谅你的用户,你的修改会让你的用户感到迷惑,若是一个用户的拥有一个版本库目录的工做拷贝,你的svn move命令也许会删除最新的版本的这个路径,当用户运行svn update,会被告知这个工做拷贝引用的路径已经再也不存在,用户须要强制使用svn switch转到新的位置。

另外一个Subversion模型的可爱特性是分支和标签能够有有限的生命周期,就像其它的版本化的项目,举个例子,假定你最终完成了calc项目你的我的分支上的全部工做,在合并了你的全部修改到/calc/trunk后,没有必要继续保留你的私有分支目录:

$ svn delete http://svn.example.com/repos/calc/branches/my-calc-branch /
-m "Removing obsolete branch of calc project."

Committed revision 375.

你的分支已经消失了,固然不是真的消失了:这个目录只是在HEAD修订版本里消失了,若是你使用svn checkoutsvn switch或者svn list来检查一个旧的版本,你仍会见到这个旧的分支。

若是浏览你删除的目录还不足够,你能够把它找回来,恢复数据对Subversion来讲很简单,若是你但愿恢复一个已经删除的目录(或文件)到HEAD,仅须要使用svn copy -r来从旧的版本拷贝出来:

$ svn copy -r 374 http://svn.example.com/repos/calc/branches/my-calc-branch /
http://svn.example.com/repos/calc/branches/my-calc-branch

Committed revision 376.

在咱们的例子里,你的我的分支只有一个相对短的生命周期:你会为修复一个Bug或实现一个小的特性来建立它,当任务完成,分支也该结束了。在软件开发过程当中,有两个“主要的”分支一直存在很长的时间也是很常见的状况,举个例子,假定咱们是发布一个稳定的calc项目的时候了,但咱们仍会须要几个月的时间来修复Bug,你不但愿添加新的特性,但你不但愿告诉开发者中止开发,因此做为替代,你为软件建立了一个“分支”,这个分支更改不会不少:

$ svn copy http://svn.example.com/repos/calc/trunk /
http://svn.example.com/repos/calc/branches/stable-1.0 /
-m "Creating stable branch of calc project."

Committed revision 377.

并且开发者能够自由的继续添加新的(试验的)特性到/calc/trunk,你能够宣布这样一种政策,只有bug修正提交到/calc/branches/stable-1.0,这样的话,人们继续在主干上工做,某我的会选择在稳定分支上作出一些Bug修正,甚至在稳定版本发布以后。你或许会在这个维护分支上工做很长时间—也就是说,你会一直继续为客户提供这个版本的支持。



[8] Subversion不支持跨版本库的拷贝,当使用svn copy或者svn move直接操做URL时你只能在同一个版本库内操做。

[9] 在未来,Subversion项目将会计划(或者发明)一种扩展补丁格式来描述目录树的结构和属性变化。

[10] Subversion项目有计划,无论用什么方式,总有一天要实现svnadmin obliterate命令来进行永久删除操做,而此时能够看“svndumpfilter”一节

[11] 由于CVS没有版本树,它会在每一个版本库目录建立一个古典区域用来保存增量数据。

[12] 当你的服务器位置改变,而你不想放弃存在的本地拷贝,你能够使用带选项--relocatesvn switch命令转换URL,见第 9 章 Subversion彻底参考svn switch查看更多信息和例子。

Subversion版本库是保存任意数量项目版本化数据的中央仓库,所以,版本库成为管理员关注的对象。版本库的维护通常并不须要太多的关注,但为了不一些潜在的问题和解决一些实际问题,理解怎样适当的配置和维护仍是很是重要的。

在这一章里,咱们将讨论如何创建和配置一个Subversion版本库,还会讨论版本库的维护,包括svnlooksvnadmin工具的使用(它们都包含在Subversion中)。咱们将说明一些常见的问题和错误,并提供一些安排版本库数据的建议。

若是您只是以普通用户的身份访问版本库对数据进行版本控制(就是说经过Subversion客户端),您彻底能够跳过本章。可是若是您已是或打算成为Subversion版本库的管理员,[13]您必定要关注一下本章的内容。

在 进入版本库管理这块宽广的主题以前,让咱们进一步肯定一下版本库的定义,它是怎样工做的?让人有什么感受?它但愿茶是热的仍是冰的,加糖或柠檬吗?做为一 名管理员,你应该既从逻辑视角-数据在版本库中如何展现,又能从物理具体细节的视角-版本库如何响应一个非Subversion的工具,来理解版本库的组 成。下面的小节从一个比较高的层面覆盖了这些基本概念。

从概念上来讲,Subversion的版本库就是一串目录树。每个目录树,就是版本库的文件和目录在某一时刻的快照。这些快照是客户端使用者操做的结果,叫作修订版本。

每 一个修订版本都是以事务树开始其生命周期。作提交操做时,客户端创建了一个映射本地修改的Subversion事务(加上客户端提交操做后任何对版本库的 更改),而后指导版本库将该树存储为下一个快照。要是提交成功,这个事务就会成为新的修订版本树,并被赋予新的修订版本号。若是由于某些缘由提交失败,事 务会被销毁,客户端将被通知这个事务失败。

更新的动做也相似这样。客户端创建一个临时的事务树,映射工做文件的状态。而后版本库比较事务树和被请求的修订版本树(一般是最新的,也就是最“年轻”的修订版本树),而后发回消息通知客户端哪些变动须要将拷贝发送到修订版本树。更新完成后,临时事务将被删除。

事 务树的使用是对版本库中版本控制文件系统产生永久变动的惟一方法。一个事务的生命周期很是灵活,了解这一点很重要。在更新的状况下,事务只是立刻会被销毁 的临时树。在提交的状况下,事务会变成固定的修订版本(若是失败的状况下,则会被删除)。在出现错误或bug的状况下,事务可能会被留在版本库中(不会影 响任何东西,可是会占据空间)。

理 论上,有一天整个流程可以发展到对事务进行更加细密的流程控制。能够想象一个系统,在客户端完成操做,将要保存到版本库中时,每一个加到它的事务都变成一个 修订版本。这将会使每个新的提交均可以被别人查看到,也许是主管,也许是质量保证小组,他们能够决定是要接收这个事务成为修订版本,仍是放弃它。

在Subversion1.1中,版本库中存储数据有两种方式。一种是在Berkeley DB数据库中存储数据;另外一种是使用普通的文件,使用自定义格式。由于Subversion的开发者称版本库为(版本化的)文件系统,他们接受了称后一种存储方式为FSFS[14]的习惯,也就是说,使用本地操做系统文件系统来存储数据的版本化文件的系统。

建 立一个版本库时,管理员必须决定使用Berkeley DB仍是FSFS。它们各有优缺点,咱们将详细描述。这两个中并无一个是更正式的,访问版本库的程序与采用哪种实现方式无关。访问程序并不知道版本库 如何存储数据,它们只是从版本库的API读取到修订版本和事务树。

表 5.1 “版本库数据存储对照表”从整体上比较了Berkeley DB和FSFS版本库,下一部分将会详细讲述细节。

表 5.1. 版本库数据存储对照表

特性 Berkeley DB FSFS
对操做中断的敏感 很敏感;系统崩溃或者权限问题会致使数据库“塞住”,须要按期进行恢复。 不敏感。
可只读加载 不能 能够
存储平台无关 不能 能够
可从网络文件系统访问 不能 能够
版本库大小 稍大 稍小
可扩展性:修订版本树的数量 数据库,没有限制 许多古老的本地文件系统在处理单一目录包含上千个条目时出现问题。
可扩展性:文件较多的目录 较慢 较快
速度:检出最新的代码 较快 较慢
速度: 大的提交 较慢,可是时间被分配在整个提交操做中 较快,可是最后较长的延时可能会致使客户端操做超时
组访问权处理 对于用户的umask设置十分敏感,最好只由一个用户访问。 对umask设置不敏感
功能成熟时间 2001年开始使用 2004年开始使用

在Subversion的初始设计阶段,开发者由于多种缘由而决定采用Berkeley DB,好比它的开源协议、事务支持、可靠性、性能、简单的API、线程安全、支持游标等。

Berkeley DB提供了真正的事务支持-这或许是它最强大的特性,访问你的Subversion版本库的多个进程没必要担忧偶尔会破坏其余进程的数据。事务系统提供的隔 离对于任何给定的操做,Subversion版本库代码看到的只是数据库的静态视图-而不是一个在其余进程影响不断变化的数据库-并可以根据该视图做出决 定。若是该决定正好同其余进程所作操做冲突,整个操做会回滚,就像什么都没有发生同样,而且Subversion会优雅的再次对更新的静态视图进行操做。

Berkeley DB另外一个强大的特性是热备份-没必要“脱机”就能够备份数据库环境的能力。咱们将会在“版本库备份”一节讨论如何备份你的版本库,可以不中止系统对版本库作全面备份的好处是显而易见的。

Berkeley DB同时是一个可信赖的数据库系统。Subversion利用了Berkeley DB能够记日志的便利,这意味着数据库先在磁盘上写一个日志文件,描述它将要作的修改,而后再作这些修改。这是为了确保若是若是任何地方出了差错,数据库 系统能恢复到先前的检查点—一个日志文件认为没有错误的位置,从新开始事务直到数据恢复为一个可用的状态。关于Berkeley DB日志文件的更多信息请查看“管理磁盘空间”一节

但 是每朵玫瑰都有刺,咱们也必须记录一些Berkeley DB已知的缺陷。首先,Berkeley DB环境不是跨平台的。你不能简单的拷贝一个在Unix上建立的Subversion版本库到一个Windows系统并指望它可以正常工做。尽管 Berkeley DB数据库的大部分格式是不受架构约束的,但环境仍是有一些方面没有独立出来。其次,使用Berkeley DB的Subversion不能在95/98系统上运行—若是你须要将版本库建在一个Windows机器上,请装到Windows2000或 WindowsXP上。另外,Berkeley DB版本库不能放在网络共享文件夹中,尽管Berkeley DB承诺若是按照一套特定规范的话,能够在网络共享上正常运行,但实际上已知的共享类型几乎都不知足这套规范。

最 后,由于Berkeley DB的库直接连接到了Subversion中,它对于中断比典型的关系型数据库系统更为敏感。大多数SQL系统,举例来讲,有一个主服务进程来协调对数据 库表的访问。若是一个访问数据库的程序由于某种缘由出现问题,数据库守护进程察觉到链接中断会作一些清理。由于数据库守护进程是惟一访问数据库表的进程, 应用程序不须要担忧访问许可的冲突。可是,这些状况与Berkeley DB不一样。Subversion(和使用Subversion库的程序)直接访问数据库的表,这意味着若是有一个程序崩溃,就会使数据库处于一个暂时的不 一致、不可访问的状态。当这种状况发生时,管理员须要让Berkeley DB恢复到一个检查点,这的确有点讨厌。除了崩溃的进程,还有一些状况能让版本库出现异常,好比程序在数据库文件的全部权或访问权限上发生冲突。由于 Berkeley DB版本库很是快,而且能够扩展,很是适合使用一个单独的服务进程,经过一个用户来访问—好比Apache的httpdsvnserve(参见第 6 章 配置服务器)—而不是多用户经过file:///svn+ssh://URL的方式多用户访问。若是将Berkeley DB版本库直接用做多用户访问,请先阅读“支持多种版本库访问方法”一节

在2004 年中期,另外一种版本库存储系统慢慢造成了:一种不须要数据库的存储系统。FSFS版本库在单一文件中存储修订版本树,因此版本库中全部的修订版本都在一个 子文件夹中有限的几个文件里。事务在单独的子目录中被建立,建立完成后,一个单独的事务文件被建立并移动到修订版本目录,这保证提交是原子性的。由于一个 修订版本文件是持久不可改变的,版本库也能够作到热备份,就象Berkeley DB版本库同样。

修 订版本文件格式表明了一个修订版本的目录结构,文件内容,和其它修订版本树中相关信息。不像Berkeley DB数据库,这种存储格式可跨平台而且与CPU架构无关。由于没有日志或用到共享内存的文件,数据库能被网络文件系统安全的访问和在只读环境下检查。缺乏 数据库花消同时也意味着版本库的整体体积能够稍小一点。

FSFS 也有一种不一样的性能特性。当提交大量文件时,FSFS使用O(N)算法来追加条目,而Berkeley DB则用(N^2)算法来重写整个目录。另外一方面,FSFS经过写入与上一个版本比较的变化来记录新版本,这也意味着获取最新修订版本时会比 Berkeley DB慢一点,提交时FSFS也会有一个更长的延迟,在某些极端状况下会致使客护端在等待回应时超时。

最重要的区别是当出现错误时FSFS不会楔住的能力。若是使用Berkeley DB的进程发生许可错误或忽然崩溃,数据库会一直没法使用,直到管理员恢复。假如在应用FSFS版本库时发生一样的状况,版本库不会受到任何干扰,最坏状况下也就是会留下一些事务数据。

惟一真正对FSFS不利的是相对于Berkeley DB的不成熟,缺少足够的使用和压力测试,许多关于速度和可扩展性的判断都是创建在良好的猜想之上。在理论上,它承诺会下降管理员新手的门槛而且更加不容易发生问题。在实践中,只有时间能够证实。

建立一个 Subversion 版本库出乎寻常的简单。 Subversion 提供的svnadmin 工具,有一个执行这个功能的子命令。要创建一个新的版本库,只须要运行:

$ svnadmin create /path/to/repos

这个命令在目录/path/to/repos建立了一个新的版本库。这个新的版本库会以修订版本版本0开始其生命周期,里面除了最上层的根目录(/),什么都没有。刚开始,修订版本0有一个修订版本属性svn:date,设置为版本库建立的时间。

在 Subversion 1.2中,版本库默认使用FSFS后端存储方式来建立(见“版本库数据存储”一节)。无论怎样,存储类型能够使用--fs-type参数明确说明:

$ svnadmin create --fs-type fsfs /path/to/repos
$ svnadmin create --fs-type bdb /path/to/other/repos

警告

不 要在网络共享上建立Berkeley DB版本库—它不能存在于诸如NFS, AFS或Windows SMB的远程文件系统中,Berkeley 数据要求底层文件系统实现严格的POSIX锁定语义,几乎没有任何网络文件系统提供这些特性,假如你在网络共享上使用Berkeley DB,结果是不可预知的——许多错误可能会马上发现,也有可能在几个月以后才能发现

假如你须要多台计算机来访问,你须要在网络共享上建立FSFS版本库,而不是Berkeley DB的版本库。或者更好的办法,你创建一个真正的服务进程(例如Apache或svnserve),把版本库放在服务器能访问到的本地文件系统中,以便能经过网络访问。详情请参看linkend="svn.serverconfig"/>。

你可能已经注意到了,svnadmin命令的路径参数只是一个普通的文件系统路径,而不是一个svn客户端程序访问版本库时使用的URL。svnadminsvnlook都被认为是服务器端工具—它们在版本库所在的机器上使用,用来检查或修改版本库,不能经过网络来执行任务。一个Subversion的新手一般会犯的错误,就是试图将URL(甚至“本地file:路径)传给这两个程序。

因此,当你运行svnadmin create命令后,就会在运行目录建立一个崭新的Subversion版本库,让咱们看一下在这个目录建立中建立了什么。

$ ls repos
conf/ dav/ db/ format hooks/ locks/ README.txt

除了README.txtformat文件,版本库目录就是一些子目录了。就像Subversion其它部分的设计同样,模块化是一个很重要的原则,并且层次化的组织要比杂乱无章好。下面是对新的版本库目录中各个项目的简要介绍:

conf

一个存储版本库配置文件的目录。

dav

提供给Apache和mod_dav_svn的目录,让它们存储本身的数据。

db

你全部的受版本控制数据的所在之处。这个目录或者是个Berkeley DB环境(尽是数据表和其余东西),或者是一个包含修订版本文件的FSFS环境。

format

包含了用来表示版本库布局版本号的整数。

hooks

一个存储钩子脚本模版的目录(还有钩子脚本自己, 若是你安装了的话)。

locks

一个存储Subversion版本库锁定数据的目录,被用来追踪对版本库的访问。

README.txt

这个文件只是用来告诉它的阅读者,他如今看的是 Subversion 的版本库。

通常来讲,你不须要手动干预版本库。svnadmin工具应该足以用来处理对版本库的任何修改,或者你也能够使用第三方工具(好比Berkeley DB的工具包)来调整部分版本库。不过仍是会有些例外状况,咱们会在这里提到。

所谓钩子就是与一些版本库事件触发的程序,例如新修订版本的建立,或是未版本化属性的修改。每一个钩子都会被告满足够多的信息,包括那是什么事件,所操做的对象,和触发事件的用户名。经过钩子的输出或返回状态,钩子程序能让工做继续、中止或是以某种方式挂起。

默认状况下,钩子的子目录中包含各类版本库钩子模板。

$ ls repos/hooks/
post-commit.tmpl post-unlock.tmpl pre-revprop-change.tmpl
post-lock.tmpl pre-commit.tmpl pre-unlock.tmpl
post-revprop-change.tmpl pre-lock.tmpl start-commit.tmpl

对 每种Subversion版本库支持的钩子的都有一个模板,经过查看这些脚本的内容,你能看到是什么事件触发了脚本及如何给传脚本传递数据。同时,这些模 版也是如何使用这些脚本,结合Subversion支持的工具来完成有用任务的例子。要实际安装一个可用的钩子,你须要在repos/hooks目录下安装一些与钩子同名(如 start-commit或者post-commit)的可执行程序或脚本。

在Unix 平台上,这意味着要提供一个与钩子同名的脚本或程序(多是shell 脚本,Python 程序,编译过的c语言二进制文件或其余东西)。固然,脚本模板文件不只仅是展现了一些信息—在Unix下安装钩子最简单的办法就是拷贝这些模板,而且去 掉.tmpl扩展名,而后自定义钩子的内容,肯定脚本是可运行的。Windows用文件的扩展名来决定一个程序是否可运行,因此你要使程序的基本名与钩子 同名,同时,它的扩展名是Windows系统所能辨认的,例如execom和批处理的bat

目前Subversion有已实现了九种钩子:

start-commit

它在提交事务产生前已运行,一般用来断定一个用户是否有权提交。版本库传给该程序两个参数:到版本库的路径,和要进行提交的用户名。若是程序返回一个非零值,会在事务产生前中止该提交操做。若是钩子程序要在stderr中写入数据,它将排队送至客户端。

pre-commit

在 事务完成提交以前运行,一般这个钩子是用来保护由于内容或位置(例如,你要求全部到一个特定分支的提交必须包括一个bug追踪的ticket号,或者是要 求日志信息不为空)而不容许的提交。版本库传递两个参数到程序:版本库的路径和正在提交的事务名称,若是程序返回非零值,提交会失败,事务也会删除。若是 钩子程序在stderr中写入了数据,也会传递到客户端。

Subversion的分发版本包括了一些访问控制脚本(在Subversion源文件目录树的tools/hook-scripts目录),能够用来被pre-commit调用来实现精密的写访问控制。另外一个选择是使用Apache的httpd模块mod_authz_svn,能够对单个目录进行读写访问控制(见“每目录访问控制”一节)。在将来的Subversion版本中,咱们计划直接在文件系统中实现访问控制列表(ACLs)。

post-commit

它在事务完成后运行,建立一个新的修订版本。大多数人用这个钩子来发送关于提交的描述性电子邮件,或者做为版本库的备份。版本库传给程序两个参数:到版本库的路径和被建立的新的修订版本号。退出程序会被忽略。

Subversion分发版本中包括mailer.pycommit-email.pl脚本(存于Subversion源代码树中的tools/hook-scripts/目录中)能够用来发送描述给定提交的email(而且或只是追加到一个日志文件),这个mail包含变化的路径清单,提交的日志信息、日期和做者以及修改文件的GNU区别样式输出。

Subversion提供的另外一个有用的工具是hot-backup.py脚本(在Subversion源代码树中的tools/backup/目录中)。这个脚本能够为Subversion版本库进行热备份(Berkeley DB数据库后端支持的一种特性),能够制做版本库每次提交的快照做为归档和紧急状况的备份。

pre-revprop-change

由于Subversion的修订版本属性不是版本化的,对这类属性的修改(例如提交日志属性svn:log)将会永久覆盖之前的属性值。由于数据在此可能丢失,因此Subversion提供了这种钩子(及与之对应的post-revprop-change),所以版本库管理员可用一些外部方法记录变化。做为对丢失未版本化属性数据的防范,Subversion客户端不能远程修改修订版本属性,除非为你的版本库实现这个钩子。

这个钩子在对版本库进行这种修改时才会运行,版本库给钩子传递四个参数:到版本库的路径,要修改属性的修订版本,通过认证的用户名和属性自身的名字。

post-revprop-change

咱们在前面提到过,这个钩子与pre-revprop-change对应。事实上,由于多疑的缘由,只有存在pre-revprop-change时这个脚本才会执行。当这两个钩子都存在时,post-revprop-change在修订版本属性被改变以后运行,一般用来发送包含新属性的email。版本库传递四个参数给该钩子:到版本库的路径,属性存在的修订版本,通过校验的产生变化的用户名,和属性自身的名字。

Subversion分发版本中包含propchange-email.pl脚本(在Subversion源代码树中的tools/hook-scripts/目录中),能够用来发送修订版本属性修改细节的email(而且或只是追加到一个日志文件)。这个email包含修订版本和发生变化的属性名,做出修改的用户和新属性值。

pre-lock

这个钩子会在每次有人尝试锁定文件时执行,能够防止彻底的锁定,或者用来制定控制哪些用户能够锁定特定路径的复杂策略,若是钩子发现已存在的钩子,也能够决定是否“窃取”这个钩子。版本库传递三个参数到钩子:到版本库的路径、锁定的路径和企图执行锁定的用户。若是程序返回非零值,锁定动做会退出,而且全部的标准输出返回到客户端。

post-lock

这个钩子在一个路径被锁定后执行,锁定的路径传递给钩子的标准输入,这个钩子也接受两个参数:到版本库的路径和企图执行锁定的用户。能够用这个钩子发送通知邮件来记录这种锁定事件,由于锁定已经发生,输出会被钩子忽略。

pre-unlock

这 个钩子在某人企图删除一个文件上的钩子时发生,能够用来制定哪些用户能够解除文件锁定的策略。制定破坏锁定的策略很是重要,若是一个用户A锁定了一个文 件,容许用户B打开这个锁?若是这个锁已经一周了呢?这种事情能够经过钩子决定并执行。版本库传递三个参数到钩子:到版本库的路径、将要解锁的路径和企图 解锁的用户。若是程序返回非零值,解锁操做退出并会将标准错误传输到客户端。

post-unlock

钩子在一个路径被解锁后执行,被解锁的路径会传递到钩子的标准输入,钩子也会获得两个参数:到版本库的路径和删除锁定的用户。能够用钩子发送记录这些事件的邮件。由于删除已经发生,钩子的输出被忽略。

警告

不要尝试用钩子脚本修改事务。一个常见的例子就是在提交时自动设置svn:eol-stylesvn:mime-type这类属性。这看起来是个好主意,但它会引发问题。主要的问题是客户并不知道由钩子脚本进行的修改,同时没有办法通告客户它的数据是过期的,这种矛盾会致使出人意料和不能预测的行为。

做为尝试修改事务的替代,咱们经过检查pre-commit钩子的事务,在不知足要求时拒绝提交。

Subversion 会试图以当前访问版本库的用户身份执行钩子。一般,对版本库的访问老是经过Apache HTTP服务器和mod_dav_svn进行,所以,执行钩子的用户就是运行Apache的用户。钩子自己须要具备操做系统级的访问许可,用户能够运行 它。另外,其它被钩子直接或间接使用的文件或程序(包括Subversion版本库自己)也要被同一个用户访问。换句话说,要注意潜在的访问控制问题,它 可能会让你的钩子没法按照你的目的顺利执行。

维 护一个Subversion版本库是一项使人沮丧的工做,主要由于有数据库后端与生俱来的复杂性。作好这项工做须要知道一些工具——它们是什么,何时 用以及如何使用。这一节将会向你介绍Subversion自带的版本库管理工具,以及如何使用它们来完成诸如版本库移植、升级、备份和整理之类的任务。

Subversion提供了一些用来建立、查看、修改和修复版本库的工具。让咱们首先详细了解一下每一个工具,而后,咱们再看一下仅在Berkeley DB后端分发版本中提供的版本数据库工具。

svnlook是Subversion提供的用来查看版本库中不一样的修订版本和事务。这个程序不会修改版本库内容-这是个“只读”的工具。svnlook一般用在版本库钩子程序中,用来记录版本库即将提交(用在pre-commit钩子时)或者已经提交的(用在post-commit钩子时)修改。版本库管理员能够将这个工具用于诊断。

svnlook 的语法很直接:

$ svnlook help
general usage: svnlook SUBCOMMAND REPOS_PATH [ARGS & OPTIONS ...]
Note: any subcommand which takes the '--revision' and '--transaction'
options will, if invoked without one of those options, act on
the repository's youngest revision.
Type "svnlook help <subcommand>" for help on a specific subcommand.

几乎svnlook的每个子命令都能操做修订版本或事务树,显示树自己的信息,或是它与版本库中上一个修订版本的不一样。你能够用--revision--transaction选 项指定要查看的修订版本或事务。注意,虽然修订版本号看起来像天然数,可是事务名称是包含英文字母与数字的字符串。请记住文件系统只容许浏览未提交的事务 (尚未造成一个新的修订版本的事务)。多数版本库没有这种事务,由于事务一般或者被提交了(这样便不能被查看),或者被停止并删除了。

若是没有--revision--transaction选项,svnlook会查看版本库中最年轻的修订版本(或“HEAD”)。当版本库中的/path/to/repos的最年轻的修订版本是19时,下边的两个命令执行结果彻底相同:

$ svnlook info /path/to/repos
$ svnlook info /path/to/repos --revision 19

这些子命令的惟一例外,是svnlook youngest命令,它不须要选项,只会显示出HEAD的修订版本号。

$ svnlook youngest /path/to/repos
19

svnlook的输出被设计为人和机器都易理解,拿info子命令举例来讲:

$ svnlook info /path/to/repos
sally
2002-11-04 09:29:13 -0600 (Mon, 04 Nov 2002)
27
Added the usual
Greek tree.

info子命令的输出定义以下:

这种输出是人可阅读的,像是时间戳这种有意义的条目,使用文本表示,而不是其余比较晦涩的方式(例如许多无聊的人推荐的十亿分之一秒的数量)。这种输出也是机器可读的—由于日志信息能够有多行,没有长度的限制,svnlook在日志消息以前提供了消息的长度,这使得脚本或者其余对这个命令进行的封装提供了更强的功能,好比日志消息使用了多少内存,或在这个输出成为最后一个字节以前应该略过多少字节。

另外一个svnlook常见的用法是查看修订版本树或事务树的内容。svnlook tree 命令显示在请求的树中的目录和文件。若是你提供了--show-ids选项,它还会显示每一个路径的文件系统节点修订版本ID(这一点对开发者每每更有用)。

$ svnlook tree /path/to/repos --show-ids
/ <0.0.1>
A/ <2.0.1>
B/ <4.0.1>
lambda <5.0.1>
E/ <6.0.1>
alpha <7.0.1>
beta <8.0.1>
F/ <9.0.1>
mu <3.0.1>
C/ <a.0.1>
D/ <b.0.1>
gamma <c.0.1>
G/ <d.0.1>
pi <e.0.1>
rho <f.0.1>
tau <g.0.1>
H/ <h.0.1>
chi <i.0.1>
omega <k.0.1>
psi <j.0.1>
iota <1.0.1>

若是你看过树中目录和文件的布局,你能够使用svnlook catsvnlook propget, 和svnlook proplist命令来查看这些目录和文件的细节。

svnlook还能够作不少别的查询,显示咱们先前提到的信息的一些子集,报告指定的修订版本或事务中哪些路径曾经被修改过,显示对文件和目录作过的文本和属性的修改,等等。下面是svnlook命令能接受的子命令的介绍,以及这些子命令的输出:

svnadmin程序是版本库管理员最好的朋友。除了提供建立Subversion版本库的功能,这个程序使你能够维护这些版本库。svnadmin的语法跟 svnlook相似:

$ svnadmin help
general usage: svnadmin SUBCOMMAND REPOS_PATH [ARGS & OPTIONS ...]
Type "svnadmin help <subcommand>" for help on a specific subcommand.

Available subcommands:
create
deltify
dump
help (?, h)

咱们已经提过svnadmincreate子命令(参照“版本库的建立和配置”一节)。本章中咱们会详细讲解大多数其余的命令。如今,咱们来简单的看一下每一个可用的子命令提供了什么功能。

create

建立一个新的Subversion版本库。

deltify

在指定的修订版本范围内,对其中修改过的路径作增量化操做。若是没有指定修订版本,这条命令会修改HEAD修订版本。

dump

导出版本库修订必定版本范围内的内容,使用可移植转储格式。

hotcopy

对版本库作热拷贝,用这个方法你能任什么时候候安全的备份版本库而无需考虑是否正在使用。

list-dblogs

(Berkeley DB版本库专有)列出Berkeley DB中与版本库有关的日志文件清单。这个清单包括全部的日志文件—仍然被版本库使用的和再也不使用的。

list-unused-dblogs

(Berkeley DB版本库专有)列出Berkeley DB版本库有关的不在使用日志文件路径清单。你能安全的从版本库中删除那些日志文件,也能够将它们存档以用来在灾难事件后版本库的恢复。

load

导入由dump子命令导出的可移植转储格式的一组修订版本。

lslocks

List and describe any locks that exist in the repository.

lstxns

列出刚刚在版本库的没有提交的Subversion事务清单。

recover

恢复版本库,一般在版本库发生了致命错误的时候,例如阻碍进程干净的关闭同版本库的链接的错误。

rmlocks

无条件删除所列路径里的锁定。

rmtxns

从版本库中清除Subversion事务(经过加工lstxns子命令的输出便可)。

setlog

替换给定修订版本的svn:log(提交日志信息)属性值。

verify

验证版本库的内容,包括校验比较本地版本化数据和版本库。

由于Subversion使用底层的数据库储存各种数据,手工调整是不明智的,即便这样作并不困难。况且,一旦你的数据存进了版本库,一般很难再将它们从版本库中删除。[15]但 是不可避免的,总会有些时候你须要处理版本库的历史数据。你也许想把一个不该该出现的文件从版本库中完全清除。或者,你曾经用一个版本库管理多个工程,现 在又想把它们分开。要完成这样的工做,管理员们须要更易于管理和扩展的方法表示版本库中的数据,Subversion版本库转储文件格式就是一个很好的选 择。

Subversion版本库转储文件记录了全部版本数据的变动信息,并且以易于阅读的格式保存。能够使用svnadmin dump命令生成转储文件,而后用svnadmin load命令生成一个新的版本库。(参见 “版本库的移植”一节)。转储文件易于阅读意味着你能够当心翼翼的查看和修改它。固然,问题是若是你有一个运行了两年的版本库,那么生成的转储文件会很庞大,阅读和手工修改起来都会花费不少时间。

虽然在管理员的平常工做中并不会常用,不过svndumpfilter能够对特定的路径进行过滤。这是一个独特而颇有意义的用法,能够帮助你快速方便的修改转储的数据。使用时,只需提供一个你想要保留的(或者不想保留的)路径列表,而后把你的版本库转储文件送进这个过滤器。最后你就能够获得一个仅包含你想保留的路径的转储数据流。

svndumpfilter的语法以下:

$ svndumpfilter help
general usage: svndumpfilter SUBCOMMAND [ARGS & OPTIONS ...]
Type "svndumpfilter help <subcommand>" for help on a specific subcommand.

Available subcommands:
exclude
include
help (?, h)

有意义的子命令只有两个。你能够使用这两个子命令说明你但愿保留和不但愿保留的路径:

exclude

将指定路径的数据从转储数据流中排除。

include

将指定路径的数据添加到转储数据流中。

如今我来演示如何使用这个命令。咱们会在其它章节(参见 “选择一种版本库布局”一节) 讨论关于如何选择设定版本库布局的问题,好比应该使用一个版本库管理多个项目仍是使用一个版本库管理一个项目,或者如何在版本库中安排数据等等。不过,有 些时候,即便在项目已经展开之后,你仍是但愿对版本库的布局作一些调整。最多见的状况是,把原来存放在同一个版本库中的几个项目分开,各自成家。

假设有一个包含三个项目的版本库: calccalendar,和 spreadsheet。它们在版本库中的布局以下:

/
calc/
trunk/
branches/
tags/
calendar/
trunk/
branches/
tags/
spreadsheet/
trunk/
branches/
tags/

如今要把这三个项目转移到三个独立的版本库中。首先,转储整个版本库:

$ svnadmin dump /path/to/repos > repos-dumpfile
* Dumped revision 0.
* Dumped revision 1.
* Dumped revision 2.
* Dumped revision 3.

$

而后,将转储文件三次送入过滤器,每次仅保留一个顶级目录,就能够获得三个转储文件:

$ cat repos-dumpfile | svndumpfilter include calc > calc-dumpfile

$ cat repos-dumpfile | svndumpfilter include calendar > cal-dumpfile

$ cat repos-dumpfile | svndumpfilter include spreadsheet > ss-dumpfile

$

如今你必需要做出一个决定了。这三个转储文件中,每一个均可以用来建立一个可用的版本库,不过它们保留了原版本库的精确路径结构。也就是说,虽然项目calc如今独占了一个版本库,但版本库中还保留着名为calc的顶级目录。若是但愿trunktagsbranches这三个目录直接位于版本库的根路径下,你可能须要编辑转储文件,调整Node-pathCopyfrom-path头参数,将路径calc/删除。同时,你还要删除转储数据中建立calc目录的部分。通常来讲,就是以下的一些内容:

Node-path: calc
Node-action: add
Node-kind: dir
Content-length: 0

警告

若是你打算经过手工编辑转储文件来移除一个顶级目录,注意不要让你的编辑器将换行符转换为本地格式(好比将/r/n转换为/n)。不然文件的内容就与所需的格式不相符,这个转储文件也就失效了。

剩下的工做就是建立三个新的版本库,而后将三个转储文件分别导入:

$ svnadmin create calc; svnadmin load calc < calc-dumpfile
<<< Started new transaction, based on original revision 1
* adding path : Makefile ... done.
* adding path : button.c ... done.

$ svnadmin create calendar; svnadmin load calendar < cal-dumpfile
<<< Started new transaction, based on original revision 1
* adding path : Makefile ... done.
* adding path : cal.c ... done.

$ svnadmin create spreadsheet; svnadmin load spreadsheet < ss-dumpfile
<<< Started new transaction, based on original revision 1
* adding path : Makefile ... done.
* adding path : ss.c ... done.

$

svndumpfilter的两个子命令均可以经过选项设定如何处理“”修订版本。若是某个指定的修订版本仅包含路径的更改,过滤器就会将它删除,由于当前为空的修订版本一般是无用的甚至是让人讨厌的。为了让用户有选择的处理这些修订版本,svndumpfilter提供了如下命令行选项:

--drop-empty-revs

不生成任何空修订版本,忽略它们。

--renumber-revs

若是空修订版本被剔除(经过使用--drop-empty-revs选项),依次修改其它修订版本的编号,确保编号序列是连续的。

--preserve-revprops

若是空修订版本被保留,保持这些空修订版本的属性(日志信息,做者,日期,自定义属性,等等)。若是不设定这个选项,空修订版本将仅保留初始时间戳,以及一个自动生成的日志信息,代表此修订版本由svndumpfilter处理过。

尽管svndumpfilter十分有用,能节省大量的时间,但它倒是把彻彻底底的双刃剑。首先,这个工具对路径语义极为敏感。仔细检查转储文件中的路径是否是以斜线开头。也许Node-pathCopyfrom-path这两个头参数对你有些帮助。


Node-path: spreadsheet/Makefile

若是这些路径以斜线开头,那么你传递给svndumpfilter includesvndumpfilter exclude的路径也必须以斜线开头(反之亦然)。若是由于某些缘由转储文件中的路径没有统一使用或不使用斜线开头,[16]也许须要修正这些路径,统一使用斜线开头或不使用斜线开头。

此外,复制操做生成的路径也会带来麻烦。Subversion支持在版本库中进行复制操做,也就是复制一个存在的路径,生成一个新的路径。问题是,svndumpfilter保留的某个文件或目录多是由某个svndumpfilter排除的文件或目录复制而来的。也就是说,为了确保转储数据的完整性,svndumpfilter需 要切断这些复制自被排除路径的文件与源文件的关系,还要将这些文件的内容以新建的方式添加到转储数据中。可是因为Subversion版本库转储文件格式 中仅包含了修订版本的更改信息,所以源文件的内容基本上没法得到。若是你不能肯定版本库中是否存在相似的状况,最好从新考虑一下到底保留/排除哪些路径。

若是你使用Berkeley DB版本库,那么全部归入版本控制的文件系统结构和数据都储存在一系列数据库的表中,而这个位于版本库的db子目录下。这个子目录是一个标准的Berkeley DB环境目录,能够应用任何Berkeley数据库工具进行操做(参考SleepyCat网站http://www.sleepycat.com/上关于这些工具的介绍)。

对于Subversion的平常使用来讲,这些工具并无什么用处。大多数Subversion版本库必须的数据库操做都集成到svnadmin工具中。好比,svnadmin list-unused-dblogssvnadmin list-dblogs实现了Berkeley db_archive命令功能的一个子集,而svnadmin recover则起到了 db_recover工具的做用。

固然,还有一些Berkeley DB工具备时是有用的。db_dump将Berkeley DB数据库中的键值对以特定的格式写入文件中,而db_load则能够将这些键值对注入到数据库中。Berkeley数据库自己不支持跨平台转移,这两个工具在这样的状况下就能够实如今平台间转移数据库的功能,而无需关心操做系统或机器架构。此外,db_stat工具可以提供关于Berkeley DB环境的许多有用信息,包括详细的锁定和存储子系统的统计信息。

Subversion版本库一旦按照须要配置完成,通常状况下不须要特别的关照。不过有些时候仍是须要管理员手工干预一下。svnadmin工具就可以帮你完成如下这类工做:

svnadmin的子命令中最常常用到的恐怕就是setlog。用户在提交时输入的日志信息随着相关事务提交到版本库并升级成为修订版本后,便做为新修订版本的非版本化(即没有进行版本管理)属性保存下来。换句话说,版本库只记得最新的属性值,而忽略之前的。

有时用户输入的日志信息有错误(好比拼写错误或者内容错误)。若是配置版本库时设置了(使用pre-revprop-changepost-revprop-change钩子;参见“钩子脚本”一节)容许用户在提交后修改日志信息的选项,那么用户能够使用svn程序的propset命令(参见第 9 章 Subversion彻底参考)“修正”日志信息中的错误。不过为了不永远丢失信息,Subversion版本库一般设置为仅能由管理员修改非版本化属性(这也是默认的选项)。

若是管理员想要修改日志信息,那么能够使用svnadmin setlog命令。这个命令从指定的文件中读取信息,取代版本库中某个修订版本的日志信息(svn:log属性)。

$ echo "Here is the new, correct log message" > newlog.txt
$ svnadmin setlog myrepos newlog.txt -r 388

即便是svnadmin setlog命令也受到限制。pre-post-revprop-change钩子一样会被触发,所以必须进行相应的设置才能容许修改非版本化属性。不过管理员能够使用svnadmin setlog命令的--bypass-hooks选项跳过钩子。

警告

不过须要注意的是,一旦跳过钩子也就跳过了钩子所提供的全部功能,好比邮件通知(通知属性有改动)、系统备份(能够用来跟踪非版本化的属性变动)等等。换句话说,要留心你所做出的修改,以及你做出修改的方式。

svnadmin的 另外一个常见用途是查询异常的—多是已经死亡的—Subversion事务。一般提交操做失败时,与之相关的事务就会被清除。也就是说,事务自己及全部与 该事务相关(且仅与该事务相关)的数据会从版本库中删除。不过偶尔也会出现操做失败而事务没有被清除的状况。出现这种状况可能有如下缘由:客户端的用户粗 暴的结束了操做,操做过程当中出现网络故障,等等。无论是什么缘由,死亡的事务老是有可能会出现。这类事务不会产生什么负面影响,仅仅是消耗了一点点磁盘空 间。不过,严厉的管理员老是但愿可以将它们清除出去。

能够使用svnadminlstxns 命令列出当前的异常事务名。

$ svnadmin lstxns myrepos
19
3a1
a45
$

将输出的结果条目做为svnlook(设置--transaction选项)的参数,就能够得到事务的详细信息,如事务的建立者、建立时间,事务已做出的更改类型,由这些信息能够判断出是否能够将这个事务安全的删除。若是能够安全删除,那么只需将事务名做为参数输入到svnadmin rmtxns,就能够将事务清除掉了。其实rmtxns子命令能够直接以lstxns的输出做为输入进行清理。

$ svnadmin rmtxns myrepos `svnadmin lstxns myrepos`
$

在按照上面例子中的方法清理版本库以前,你或许应该暂时关闭版本库和客户端的链接。这样在你开始清理以前,不会有正常的事务进入版本库。下面例子中的shell脚本能够用来迅速得到版本库中异常事务的信息:

能够用下面的命令使用上例中脚本: /path/to/txn-info.sh /path/to/repos。该命令的输出主要由多个svnlook info参见“svnlook”一节)的输出组成,相似于下面的例子:

$ txn-info.sh myrepos
---[ Transaction 19 ]-------------------------------------------
sally
2001-09-04 11:57:19 -0500 (Tue, 04 Sep 2001)
0
---[ Transaction 3a1 ]-------------------------------------------
harry
2001-09-10 16:50:30 -0500 (Mon, 10 Sep 2001)
39
Trying to commit over a faulty network.
---[ Transaction a45 ]-------------------------------------------
sally
2001-09-12 11:09:28 -0500 (Wed, 12 Sep 2001)
0
$

一个废弃了很长时间的事务一般是提交错误或异常中断的结果。事务的时间戳能够提供给咱们一些有趣的信息,好比一个进行了9个月的操做竟然仍是活动的等等。

简 言之,做出事务清理的决定前应该仔细考虑一下。许多信息源—好比Apache的错误和访问日志,已成功完成的Subversion提交日志等等—均可以做 为决策的参考。管理员还能够直接和那些彷佛已经死亡事务的提交者直接交流(好比经过邮件),来确认该事务确实已经死亡了。

虽 然存储器的价格在过去的几年里以让人难以至信的速度滑落,可是对于那些须要对大量数据进行版本管理的管理员们来讲,磁盘空间的消耗依然是一个重要的因素。 版本库每增长一个字节都意味着须要多一个字节的磁盘空间进行备份,对于多重备份来讲,就须要消耗更多的磁盘空间。Berkeley DB版本库的主要存储机制是基于一个复杂的数据库系统创建的,所以了解一些数据性质是有意义的,好比哪些数据必须保留。哪些数据须要备份、哪些数据能够安 全的删除等等。本节的内容专一于Berkeley DB类型的版本库。FSFS类型的版本库不须要进行数据清理和回收。

目 前为止,Subversion版本库中耗费磁盘空间的最大凶手是日志文件,每次Berkeley DB在修改真正的数据文件以前都会进行预写入(pre-writes)操做。这些文件记录了数据库从一个状态变化到另外一个状态的全部动做——数据库文件反 应了特定时刻数据库的状态,而日志文件则记录了全部状态变化的信息。所以,日志文件会以很快的速度膨胀起来。

幸运的是,从版本4.2开始,Berkeley DB的数据库环境无需额外的操做便可删除无用的日志文件。若是编译svnadmin时使用了高于4.2版本的Berkeley DB,那么由此svnadmin程序建立的版本库就具有了自动清除日志文件的功能。若是想屏蔽这个功能,只需设置svnadmin create命令的--bdb-log-keep选项便可。若是建立版本库之后想要修改关于此功能的设置,只需编辑版本库中db目录下的DB_CONFIG文件,注释掉包含set_flags DB_LOG_AUTOREMOVE内容的这一行,而后运行svnadmin recover强制设置生效就好了。查阅“Berkeley DB配置”一节得到更多关于数据库配置的帮助信息。

若是不自动删除日志文件,那么日志文件会随着版本库的使用逐渐增长。这多少应该算是数据库系统的特性,经过这些日志文件能够在数据库严重损坏时恢复整个数据库的内容。可是通常状况下,最好是可以将无用的日志文件收集起来并删除,这样就能够节省磁盘空间。使用svnadmin list-unused-dblogs命令能够列出无用的日志文件:

$ svnadmin list-unused-dblogs /path/to/repos
/path/to/repos/log.0000000031
/path/to/repos/log.0000000032
/path/to/repos/log.0000000033

$ svnadmin list-unused-dblogs /path/to/repos | xargs rm
## disk space reclaimed!

为了尽量减少版本库的体积,Subversion在版本库中采用了增量化技术(或称为“增量存储技术”)。 增量化技术能够将一组数据表示为相对于另外一组数据的不一样。若是这两组数据十分类似,增量化技术就能够仅保存其中一组数据以及两组数据的差异,而不须要同时 保存两组数据,从而节省了磁盘空间。每次一个文件的新版本提交到版本库,版本库就会将以前的版本(以前的多个版本)相对于新版本作增量化处理。采用了这项 技术,版本库的数据量大小基本上是能够估算出来的—主要是版本化的文件的大小—而且远小于“全文”保存所需的数据量。

注意

由 于Subversion版本库的增量化数据保存在单一Berkeley DB数据库文件中,减小数据的体积并不必定可以减少数据库文件的大小。可是,Berkeley DB会在内部记录未使用的数据库文件区域,而且在增长数据库文件大小以前会首先使用这些未使用的区域。所以,即便增量化技术不能立杆见影的节省磁盘空间, 也能够极大的减慢数据库的膨胀速度。

“Berkeley DB”一节中曾提到,Berkeley DB版本库若是没有正常关闭可能会进入冻结状态。这时,就须要管理员将数据库恢复到正常状态。

Berkeley DB使用一种锁机制保护版本库中的数据。锁机制确保数据库不会同时被多个访问进程修改,也就保证了从数据库中读取到的数据始终是稳定并且正确的。当一个进 程须要修改数据库中的数据时,首先必须检查目标数据是否已经上锁。若是目标数据没有上锁,进程就将它锁上,而后做出修改,最后再将锁解除。而其它进程则必 须等待锁解除后才能继续访问数据库中的相关内容。

在操做Subversion版本库的过程当中,致命错误(如内存或硬盘空间不足)或异常中断可能会致使某个进程没能及时将锁解除。结果就是后端的数据库系统被“塞住”了。一旦发生这种状况,任何访问版本库的进程都会挂起(每一个访问进程都在等待锁被解除,可是锁已经没法解除了)。

首先,若是你的版本库出现这种状况,没什么好惊慌的。Berkeley DB的文件系统采用了数据库事务、检查点以及预写入日志等技术来取保只有灾难性的事件[17]才能永久性的破坏数据库环境。因此虽然一个过于稳重的版本库管理员一般都会按照某种方案进行大量的版本库离线备份,不过不要急着通知你的管理员进行恢复。

而后,使用下面的方法试着“恢复”你的版本库:

  1. 确保没有其它进程访问(或者试图访问)版本库。对于网络版本库,关闭Apache HTTP服务器是个好办法。

  2. 成为版本库的拥有者和管理员。这一点很重要,若是以其它用户的身份恢复版本库,可能会改变版本库文件的访问权限,致使在版本库“恢复”后依旧没法访问。

  3. 运行命令svnadmin recover /path/to/repos。 输出以下:

    Repository lock acquired。
    Please wait; recovering the repository may take some time...

    Recovery completed.
    The latest repos revision is 19.

    此命令可能须要数分钟才能完成。

  4. 从新启动Subversion服务器。

这个方法能修复几乎全部版本库锁住的问题。记住,要以数据库的拥有者和管理员的身份运行这个命令,而不必定是root用户。恢复过程当中可能会使用其它数据存储区(例如共享内存区)重建一些数据库文件。若是以root用户身份恢复版本库,这些重建的文件拥有者将变成root用户,也就是说,即便恢复了到版本库的链接,通常的用户也无权访问这些文件。

若是由于某些缘由,上面的方法没能成功的恢复版本库,那么你能够作两件事。首先,将破损的版本库保存到其它地方,而后从最新的备份中恢复版本库。而后,发送一封邮件到Subversion用户列表(地址是:),写清你所遇到的问题。对于Subversion的开发者来讲,数据安全是最重要的问题。

Subversion文件系统将数据保存在许多数据库表中,而这些表的结构只有Subversion开发者们才了解(也只有他们才感兴趣)不过,有些时候咱们会想到把全部的数据(或者一部分数据)保存在一个独立的、可移植的、普通格式的文件中。Subversion经过svnadmin的两个子命令dumpload提供了相似的功能。

对 版本库的转储和装载的需求主要仍是因为Subversion自身处于变化之中。在Subversion的成长期,后端数据库的设计屡次发生变化,这些变化 致使以前的版本库出现兼容性问题。固然,将Berkeley DB版本库移植到不一样的操做系统或者CPU架构上,或者在Berkeley DB和FSFS后端之间进行转化也须要转储和装载功能。按照下面的介绍,只需简单几步就能够完成数据库的移植:

svnadmin dump命令会将版本库中的修订版本数据按照特定的格式输出到转储流中。转储数据会输出到标准输出流,而提示信息会输出到标准错误流。这就是说,能够将转储数据存储到文件中,而同时在终端窗口中监视运行状态。例如:

$ svnlook youngest myrepos
26
$ svnadmin dump myrepos > dumpfile
* Dumped revision 0.
* Dumped revision 1.
* Dumped revision 2.

* Dumped revision 25.
* Dumped revision 26.

最后,版本库中的指定的修订版本数据被转储到一个独立的文件中(在上面的例子中是dumpfile)。注意,svnadmin dump从版本库中读取修订版本树与其它“读者”(好比svn checkout)的过程相同,因此能够在任什么时候候安全的运行这个命令。

另外一个命令,svnadmin load,从标准输入流中读取Subversion转储数据,而且高效的将数据转载到目标版本库中。这个命令的提示信息输出到标准输出流中:

$ svnadmin load newrepos < dumpfile
<<< Started new txn, based on original revision 1
* adding path : A ... done.
* adding path : A/B ... done.

------- Committed new rev 1 (loaded from original rev 1) >>>

<<< Started new txn, based on original revision 2
* editing path : A/mu ... done.
* editing path : A/D/G/rho ... done.

------- Committed new rev 2 (loaded from original rev 2) >>>



<<< Started new txn, based on original revision 25
* editing path : A/D/gamma ... done.

------- Committed new rev 25 (loaded from original rev 25) >>>

<<< Started new txn, based on original revision 26
* adding path : A/Z/zeta ... done.
* editing path : A/mu ... done.

------- Committed new rev 26 (loaded from original rev 26) >>>

load命令的结果就是添加一些新的修订版本—与使用普通Subversion客户端直接提交到版本库相同。正像一次简单的提交,你也能够使用钩子脚本在每次load的开始和结束执行一些操做。经过传递--use-pre-commit-hook--use-post-commit-hook选项给svnadmin load,你能够告诉Subversion的对每个加载修订版本执行pre-commit和post-commit钩子脚本,能够利用这个选项确保这种提交也能经过通常提交的检验。固然,你要当心使用这个选项,你必定不像接受一大堆提交邮件。你能够查看“钩子脚本”一节来获得更多相关信息。

既然svnadmin使用标准输入流和标准输出流做为转储和装载的输入和输出,那么更漂亮的用法是(管道两端能够是不一样版本的svnadmin

$ svnadmin create newrepos
$ svnadmin dump myrepos | svnadmin load newrepos

默认状况下,转储文件的体积可能会至关庞大——比版本库 自身大不少。这是由于在转储文件中,每一个文件的每一个版本都以完整的文本形式保存下来。这种方法速度很快,并且很简单,尤为是直接将转储数据经过管道输入到 其它进程中时(好比一个压缩程序,过滤程序,或者一个装载进程)。不过若是要长期保存转储文件,那么能够使用--deltas选项来节省磁盘空间。设置这个选项,同一个文件的数个连续修订版本会以增量式的方式保存—就像储存在版本库中同样。这个方法较慢,可是转储文件的体积则基本上与版本库的体积至关。

以前咱们提到svnadmin dump输出指定的修订版本。使用--revision选项能够指定一个单独的修订版本,或者一个修订版本的范围。若是忽略这个选项,全部版本库中的修订版本都会被转储。

$ svnadmin dump myrepos --revision 23 > rev-23.dumpfile
$ svnadmin dump myrepos --revision 100:200 > revs-100-200.dumpfile

Subversion在转储修订版本时,仅会输出与前一个修订版本之间的差别,经过这些差别足以从前一个修订版本中重建当前的修订版本。换句话说,在转储文件中的每个修订版本仅包含这个修订版本做出的修改。这个规则的惟一一个例外是当前svnadmin dump转储的第一个修订版本。

默认状况下,Subversion不会把转储的第一个修订版本看做对前一个修订版本的更改。 首先,转储文件中没有比第一个修订版本更靠前的修订版本了!其次,Subversion不知道装载转储数据时(若是真的须要装载的话)的版本库是什么样的状况。为了保证每次运行svnadmin dump都能获得一个独立的结果,第一个转储的修订版本默认状况下会完整的保存目录、文件以及属性等数据。

不过,这些都是能够改变的。若是转储时设置了--incremental选项,svnadmin会比较第一个转储的修订版本和版本库中前一个修订版本,就像对待其它转储的修订版本同样。转储时也是同样,转储文件中将仅包含第一个转储的修订版本的增量信息。这样的好处是,能够建立几个连续的小体积的转储文件代替一个大文件,好比:

$ svnadmin dump myrepos --revision 0:1000 > dumpfile1
$ svnadmin dump myrepos --revision 1001:2000 --incremental > dumpfile2
$ svnadmin dump myrepos --revision 2001:3000 --incremental > dumpfile3

这些转储文件能够使用下列命令装载到一个新的版本库中:

$ svnadmin load newrepos < dumpfile1
$ svnadmin load newrepos < dumpfile2
$ svnadmin load newrepos < dumpfile3

另外一个有关的技巧是,能够使用--incremental选项在一个转储文件中增长新的转储修订版本。举个例子,能够使用post-commit钩子在每次新的修订版本提交后将其转储到文件中。或者,能够编写一个脚本,在天天夜里将全部新增的修订版本转储到文件中。这样,svnadmindumpload命令就变成了很好的版本库备份工具,万一出现系统崩溃或其它灾难性事件,它的价值就体现出来了。

转储还能够用来将几个独立的版本库合并为一个版本库。使用svnadmin load--parent-dir选项,能够在装载的时候指定根目录。也就是说,若是有三个不一样版本库的转储文件,好比calc-dumpfilecal-dumpfile,和ss-dumpfile,能够在一个新的版本库中保存全部三个转储文件中的数据:

$ svnadmin create /path/to/projects
$

而后在版本库中建立三个目录分别保存来自三个不一样版本库的数据:

$ svn mkdir -m "Initial project roots" /
file:///path/to/projects/calc /
file:///path/to/projects/calendar /
file:///path/to/projects/spreadsheet
Committed revision 1.
$

最后,将转储文件分别装载到各自的目录中:

$ svnadmin load /path/to/projects --parent-dir calc < calc-dumpfile

$ svnadmin load /path/to/projects --parent-dir calendar < cal-dumpfile

$ svnadmin load /path/to/projects --parent-dir spreadsheet < ss-dumpfile

$

咱们再介绍一下Subversion版本库转储数据的最后一种用途——在不一样的存储机制或版本控制系统之间转换。由于转储数据的格式的大部分是能够阅读的,[18]因此使用这种格式描述变动集(每一个变动集对应一个新的修订版本)会相对容易一些。事实上,cvs2svn工具(参见 “转化CVS版本库到Subversion”一节)正是将CVS版本库的内容转换为转储数据格式,如此才能将CVS版本库的数据导入Subversion版本库之中。

尽管现代计算机的诞生带来了许多便利,但有一件事听起来是彻底正确的—有时候,事情变的糟糕,很糟糕,动力损耗、网络中断、坏掉的内存和损坏的硬盘都是对魔鬼的一种体验,即便对于最尽职的管理员,命运也早已注定。因此咱们来到了这个最重要的主题—怎样备份你的版本库数据。

Subversion版本库管理员一般有两种备份方式—增量的和彻底的。咱们在早先的章节曾经讨论过如何使用svnadmin dump --incremental命令执行增量备份(见“版本库的移植”一节),从本质上讲,这个方法只是备份了从你上次备份版本库到如今的变化。

一个彻底的版本库备份照字面上讲就是对整个版本库目录的复制(包括伯克利数据库或者文件FSFS环境),如今,除非你临时关闭了其余对版本库的访问,不然仅仅作一次迭代的拷贝会有产生错误备份的风险,由于有人可能会在并行的写数据库。

若是是伯克利数据库,恼人的文档描述了保证安全拷贝的步骤,对于FSFS的数据,也有相似的顺序。咱们有更好的选择,咱们不须要本身去实现这个算法,由于Subversion开发小组已经为你实现了这些算法。Subversion源文件分发版本的tools/backup/目录有一个hot-backup.py文件。只要给定了版本库路径和备份路径,hot-backup.py—一个包裹了svnadmin hotcopy但更加智能的命令—将会执行必要的步骤来备份你的活动的版本库—不须要你首先禁止公共的版本库访问—并且以后会从你的版本库清理死掉的伯克利日志文件。

甚至当你用了一个增量备份时,你也会但愿有计划的运行这个程序。举个例子,你考虑在你的调度程序(如Unix下的cron)里加入hot-backup.py,或者你喜欢更加细致的备份解决方案,你可让你的post-commit的钩子脚本执行hot-backup.py(见see “钩子脚本”一节),这样会致使你的版本库的每次提交执行一次备份,只要在你的hooks/post-commit脚本里添加以下代码:

(cd /path/to/hook/scripts; ./hot-backup.py ${REPOS} /path/to/backups &)

做为结果的备份是一个彻底功能的版本库,当发生严重错误时能够做为你的活动版本库的替换。

两种备份方式都有各自的优势,最简单的方式是彻底备份,将会每次创建版本库的完美复制品,这意味着若是当你的活动版本库发生了什么事情,你能够用备份恢复。但不幸的是,若是你维护多个备份,每一个彻底的备份会吞噬掉和你的活动版本库一样的空间。

增 量备份会使用的版本库转储格式,在Subversion的数据库模式改变时很是完美,所以当咱们升级Subversion数据库模式的时候,一个完整的版 本库导出和导入是必须的,作一半工做很是的容易(导出部分),不幸的是,增量备份的建立和恢复会占用很长时间,由于每一次提交都会被重放。

在 每一种备份情境下,版本库管理员须要意识到对未版本化的修订版本属性的修改对备份的影响,由于这些修改自己不会产生新的修订版本,因此不会触发post- commit的钩子程序,也不会触发pre-revprop-change和post-revprop-change的钩子。 [19] 并且由于你能够改变修订版本的属性,而不须要遵守时间顺序—你可在任什么时候刻修改任何修订版本的属性—所以最新版本的增量备份不会捕捉到之前特定修订版本的属性修改。

通 常说来,在每次提交时,只有妄想狂才会备份整个版本库,然而,假设一个给定的版本库拥有一些恰当粒度的冗余机制(如每次提交的邮件)。版本库管理员也许会 但愿将版本库的热备份引入到系统级的每夜备份,对大多数版本库,归档的提交邮件为保存资源提供了足够的冗余措施,至少对于最近的提交。可是它是你的数据— 你喜欢怎样保护均可以。

一般状况下,最好的版本库备份方式是 混合的,你能够平衡彻底和增量备份,另外配合提交邮件的归档,Subversion开发者,举个例子,在每一个新的修订版本创建时备份Subversion 的源代码版本库,而且保留全部的提交和属性修改通知文件。你的解决方案相似,必须迎合你的须要,平衡便利和你的偏执。然而这些不会改变你的硬件来自钢铁的 命运。[20] 这必定会帮助你减小尝试的时间。

一旦你的版本库已经创建而且配置好了,剩下的就是使用了。若是你已经准备好了须要版本控制的数据,那么能够使用客户端软件svnimport子命令来实现你的指望。不过在这样作以前,你最好对版本库仔细的做一个长远的规划。本节,咱们会给你一些好的建议,这些建议能够帮助你设计版本库的文件布局,以及如何在特定的布局中安排你的数据。

在Subversion版本库中,移动版本化的文件和目录不会损失任何信息,可是这样一来那些常常访问版本库而且觉得文件老是在同一个路径的用户可能会受到干扰。为未来着想,最好预先对你的版本库布局进行规划。以一种高效的“布局”开始项目,能够减小未来不少没必要要的麻烦。

在 创建Subversion版本库以前,有不少事情须要考虑。假如你是一个版本库管理员,须要向多个项目提供版本控制支持。那么,你首先要决定的是,用一个 版本库支持多个项目,仍是为每一个项目创建一个版本库,仍是为其中的某些项目提供独立的版本库支持,而将另一些项目分布在几个版本库中。

使 用一个版本库支持多个项目有不少好处,最明显的无过于不须要维护好几个版本库。单一版本库就意味着只有一个钩子集,只须要备份一个数据库,当 Subversion进行不兼容升级时,只须要一次转储和装载操做,等等。还有,你能够轻易的在项目之间移动数据,还不会损失任何历史版本信息。

单 一版本库的缺点是,不一样的项目一般都有不一样的提交邮件列表或者不一样的权限认证和权限要求。还有,别忘了Subversion的修订版本号是针对整个版本库 的。即便最近没有对某个项目做出修改,版本库的修订版本号仍是会由于其它项目的修改而不停的提高,许多人并不喜欢这样的事实。

能够采用折中的办法。好比,能够把许多项目按照彼此之间的关联程度划分为几个组合,而后为每个项目组合创建一个版本库。这样,在相关项目之间共享数据依旧很简单,而若是修订版本号有了变化,至少开发人员知道,改变的东西多少和他们有些关系。

在决定了如何用版本库组织项目之后,就该决定如何设置版本库的目录层次了。因为Subversion按普通的目录复制方式完成分支和标签操做(参见第 4 章 分支与合并),Subversion社区建议为每个项目创建一个项目根目录—项目的“顶级”目录—而后在根目录下创建三个子目录:trunk,保存项目的开发主线;branches,保存项目的各类开发分支;tags,保存项目的标签,也就是建立后永远不会修改的分支(可能会删除)。 [21]

举个例子,一个版本库可能会有以下的布局:

/
calc/
trunk/
tags/
branches/
calendar/
trunk/
tags/
branches/
spreadsheet/
trunk/
tags/
branches/

项目在版本库中的根目录地址并不重要。若是每一个版本库中 只有一个项目,那么就能够认为项目的根目录就是版本库的根目录。若是版本库中包含多个项目,那么能够将这些项目划分红不一样的组合(按照项目的目标或者是否 须要共享代码甚至是字母顺序)保存在不一样子目录中,下面的例子给出了一个相似的布局:

/
utils/
calc/
trunk/
tags/
branches/
calendar/
trunk/
tags/
branches/

office/
spreadsheet/
trunk/
tags/
branches/

按照你由于合适方式安排版本库的布局。Subversion自身并不强制或者偏好某一种布局形式,对于Subversion来讲,目录就是目录。最后,在设计版本库布局的时候,不要忘了考虑一下项目参与者们的意见。

设计好版本库的布局后,就该在版本库中实现布局和导入初始数据了。在Subversion中,有不少种方法完成这项工做。能够使用svn mkdir命令(参见第 9 章 Subversion彻底参考)在版本库中逐个建立须要的目录。更快捷的方法是使用svn import命令(参见svn import”一节)。首先,在硬盘上建立一个临时目录,并按照设计好的布局在其中建立子目录,而后经过导入命令一次性的提交整个布局到版本库中:

$ mkdir tmpdir
$ cd tmpdir
$ mkdir projectA
$ mkdir projectA/trunk
$ mkdir projectA/branches
$ mkdir projectA/tags
$ mkdir projectB
$ mkdir projectB/trunk
$ mkdir projectB/branches
$ mkdir projectB/tags

$ svn import . file:///path/to/repos --message 'Initial repository layout'
Adding projectA
Adding projectA/trunk
Adding projectA/branches
Adding projectA/tags
Adding projectB
Adding projectB/trunk
Adding projectB/branches
Adding projectB/tags

Committed revision 1.
$ cd ..
$ rm -rf tmpdir
$

而后能够使用svn list命令确认导入的结果是否正确::

$ svn list --verbose file:///path/to/repos
1 harry May 08 21:48 projectA/
1 harry May 08 21:48 projectB/

$

建立了版本库布局之后,若是有项目的初始数据,那么能够将这些数据导入到版本库中。一样有不少种方法完成这项工做。首先,能够使用svn import命令。也能够先从版本库中取出工做副本,将已有的项目数据复制到工做副本中,再使用svn addsvn commit命令提交修改。不过这些工做就不属于版本库管理方面的内容了。若是对svn 客户端程序还不熟悉,请阅读第 3 章 指导教程



[13] 这可能听起来很崇高, 但咱们所指的只是那些对管理别人工做拷贝数据以外的神秘领域感兴趣的人。

[14] 读做“fuzz-fuzz”, 若是Jack Repenning提及这个问题。

[15] 顺便说一句,这是Subversion的特性,而不是bug。

[16] 尽管svnadmin dump对是否以斜线做为路径的开头有统一的规定——这个规定就是不以斜线做为路径的开头——其它生成转储文件的程序不必定会遵照这个规定。

[17] 好比:硬盘 + 大号电磁铁 = 毁灭。

[18] Subversion版本库的转储文件格式相似于RFC-822格式,后者普遍的应用于电子邮件系统中。

[19] svnadmin setlog能够被绕过钩子程序被调用。

[20] 你知道的—只是对各类变化莫测的问题的统称。

[21] trunktagsbranches能够使用“TTB目录”来表示。

一个Subversion的版本库能够和客户端同时运行在同一个机器上,使用file:///访问,可是一个典型的Subversion设置应该包括一个单独的服务器,能够被办公室的全部客户端访问—或者有多是整个世界。

本小节描述了怎样将一个Subversion的版本库暴露给远程客户端,咱们会覆盖Subversion已存在的服务器机制,讨论各类方式的配置和使用。通过阅读本小节,你能够决定你须要哪一种网络设置,而且明白怎样在你的主机上进行配置。

Subversion的设计包括一个抽象的网络层,这意味着版本库能够经过各类服务器进程访问,并且客户端“版本库访问”的API容许程序员写出相关协议的插件,理论上讲,Subversion能够使用无限数量的网络协议实现,目前实践中存在着两种服务器。

Apache是最流行的web服务器,经过使用mod_dav_svn模块,Apache能够访问版本库,而且能够使客户端使用HTTP的扩展协议WebDAV/DeltaV进行访问,另外一个是svnserve:一个小的,独立服务器,使用本身定义的协议和客户端,表格6-1比较了这两种服务器。

须要注意到Subversion做为一个开源的项目,并无官方的指定何种服务器是“主要的”或者是“官方的”,并无那种网络实现被视做二等公民,每种服务器都有本身的优势和缺点,事实上,不一样的服务器能够并行工做,分别经过本身的方式访问版本库,它们之间不会互相阻碍(见“支持多种版本库访问方法”一节)。表 6.1 “网络服务器比较”是对两种存在的Subversion服务器的比较—做为一个管理员,你更加胜任给你和你的用户挑选服务器的任务。

表 6.1. 网络服务器比较

特性 Apache + mod_dav_svn svnserve
认证选项 HTTP(S) basic auth、X.509 certificates、LDAP、NTLM或任何Apache httpd已经具有的方式 CRAM-MD5或SSH
用户账号选项 私有的'users'文件 私有的'users'文件,或存在的系统(SSH)账户
受权选项 总体的读/写访问,或者是每目录的读/写访问 总体的读/写访问,或者是使用pre-commit钩子的每目录写访问(但不是读)
加密 经过选择SSL 经过选择SSH通道
交互性 能够部分的被其余WebDAV客户端使用 不能被其余客户端使用
Web浏览能力 有限的内置支持,或者经过第三方工具,如ViewCVS 经过第三方工具,如ViewCVS
速度 有些慢 快一点
初始化配置 有些复杂 至关简单

这部分是讨论了Subversion客户端和服务器怎样互相交流,不考虑具体使用的网络实现,经过阅读,你会很好的理解服务器的行为方式和多种客户端与之响应的配置方式。

Subversion客户端花费大量的时间来管理工做拷贝,当它须要版本库信息,它会作一个网络请求,而后服务器给一个恰当的回答,具体的网络协议细节对用户不可见,客户端尝试去访问一个URL,根据URL模式的不一样,会使用特定的协议与服务器联系(见版本库的URL),用户能够运行svn --version来查看客户端能够使用的URL模式和协议。

当服务器处理一个客户端请求,它一般会要求客户端肯定它本身的身份,它会发出一个认证请求给客户端,而客户端经过提供凭证给服务器做为响应,一旦认证结束,服务器会响应客户端最初请求的信息。注意这个系统与CVS之类的系统不同,它们会在请求以前,预先提供凭证(“logs in”)给服务器,在Subversion里,服务器经过请求客户端适时地“拖入”凭证,而不是客户端“”出。这使得这种操做更加的优雅,例如,若是一个服务器配置为世界上的任何人均可以读取版本库,在客户使用svn checkout时,服务器永远不会发起一个认证请求。

若是客户端请求往版本库写入新的数据(例如svn commit),这会创建新的修订版本树,若是客户端的请求是通过认证的,认证过的用户的用户名就会做为svn:author属性的值保存到新的修订本里(见“未受版本控制的属性”一节)。若是客户端没有通过认证(换句话说,服务器没有发起过认证请求),这时修订本的svn:author的值是空的。[22]

许多服务器配置为在每次请求时要求认证,这对一次次输入用户名和密码的用户来讲是很是恼人的事情。

使人高兴的是,Subversion客户端对此有一个修补:存在一个在磁盘上保存认证凭证缓存的系统,缺省状况下,当一个命令行客户端成功的在服务器上获得认证,它会保存一个认证文件到用户的私有运行配置区—类Unix系统下会在~/.subversion/auth/,Windows下在%APPDATA%/Subversion/auth/(运行区在“运行配置区”一节会有更多细节描述)。成功的凭证会缓存在磁盘,以主机名、端口和认证域的组合做为惟一性区别。

当客户端接收到一个认证请求,它会首先查找磁盘中的认证凭证缓存,若是没有发现,或者是缓存的凭证认证失败,客户端会提示用户须要这些信息。

十分关心安全的人们必定会想“把密码缓存在磁盘?太可怕了,永远不要这样作!”可是请保持冷静,并无你想象得那么可怕。

  • auth/缓存区只有用户(拥有者)能够访问,而不是全世界均可以,操做系统的访问许可能够保护密码文件。

  • 在Windows 2000或更新的系统上,Subversion客户端使用标准Windows加密服务来加密磁盘上的密码。由于加密密钥是Windows管理的,与用户的 登录凭证相关,只有用户能够解密密码。(注意:若是用户的Windows帐户密码修改了,全部的缓存密码就不能够解密了,此时Subversion客户端 就会当它们根本不存在,在须要时继续询问密码。)

  • 真正的偏执狂才会牺牲全部的便利,能够彻底的关闭凭证缓存。

你能够关闭凭证缓存,只须要一个简单的命令,使用参数--no-auth-cache

$ svn commit -F log_msg.txt --no-auth-cache
Authentication realm: <svn://host.example.com:3690> example realm
Username: joe
Password for 'joe':

Adding newfile
Transmitting file data .
Committed revision 2324.

# password was not cached, so a second commit still prompts us

$ svn delete newfile
$ svn commit -F new_msg.txt
Authentication realm: <svn://host.example.com:3690> example realm
Username: joe

或许,你但愿永远关闭凭证缓存,你能够编辑你的运行配置文件(坐落在auth/目录),只须要把store-auth-creds设置为no,这样就不会有凭证缓存在磁盘。

[auth]
store-auth-creds = no

有时候,用户但愿从磁盘缓存删除特定的凭证,为此你能够浏览到auth/区域,删除特定的缓存文件,凭证都是做为一个单独的文件缓存,若是你打开每个文件,你会看到键和值,svn:realmstring描述了这个文件关联的特定服务器的域:

$ ls ~/.subversion/auth/svn.simple/
5671adf2865e267db74f09ba6f872c28
3893ed123b39500bca8a0b382839198e
5c3c22968347b390f349ff340196ed39

$ cat ~/.subversion/auth/svn.simple/5671adf2865e267db74f09ba6f872c28

K 8
username
V 3
joe
K 8
password
V 4
blah
K 15
svn:realmstring
V 45
<https://svn.domain.com:443> Joe's repository
END

一旦你定位了正确的缓存文件,只须要删除它。

客户端认证的行为的最后一点:对使用--username--password选项的一点说明,许多客户端和子命令接受这个选项,可是要明白使用这个选项不会主动地发送凭证信息到服务器,就像前面讨论过的,服务器会在须要的时候才会从客户端“”入凭证,客户端不会随意“”出。若是一个用户名和/或者密码做为选项传入,它们只会在服务器须要时展示给服务器。[23]一般,只有在以下状况下才会使用这些选项:

  • 用户但愿使用与登录系统不一样的名字认证,或者

  • 一段不但愿使用缓存凭证但须要认证的脚本

这里是Subversion客户端在收到认证请求的时候的行为方式:

  1. 检查用户是否经过--username和/或--password命令选项指定了任何凭证信息,若是没有,或者这些选项没有认证成功,而后

  2. 查找运行中的auth/区域保存的服务器域信息,来肯定用户是否已经有了恰当的认证缓存,若是没有,或者缓存凭证认证失败,而后

  3. 提示用户输入。

若是客户端经过以上的任何一种方式成功认证,它会尝试在磁盘缓存凭证(除非用户已经关闭了这种行为方式,在前面提到过。)

svnserve是一个轻型的服务器,能够同客户端经过在TCP/IP基础上的自定义有状态协议通信,客户端经过使用开头为svn://或者svn+ssh://svnserve的URL来访问一个svnserve服务器。这一小节将会解释运行svnserve的不一样方式,客户端怎样实现服务器的认证,怎样配置版本库恰当的访问控制。

有许多调用svnserve的方式,若是调用时没有参数,你只会看到一些帮助信息,然而,若是你计划使用inetd启动进程,你能够传递-i--inetd)选项:

$ svnserve -i
( success ( 1 2 ( ANONYMOUS ) ( edit-pipeline ) ) )

当用参数--inetd调用时,svnserve会尝试使用自定义协议经过stdinstdout来与Subversion客户端通话,这是使用inetd工做的标准方式,IANA为Subversion协议保留3690端口,因此在类Unix系统你能够在/etc/services添加以下的几行(若是他们还不存在):

svn           3690/tcp   # Subversion
svn 3690/udp # Subversion

若是系统是使用经典的类Unix的inetd守护进程,你能够在/etc/inetd.conf添加这几行:

svn stream tcp nowait svnowner /usr/bin/svnserve svnserve -i

肯定“svnowner”用户拥有访问版本库的适当权限,如今若是一个客户链接来到你的服务器的端口3690,inetd会产生一个svnserve进程来作服务。

在一个Windows系统,有第三方工具能够将svnserve做为服务运行,请看Subversion的网站的工具列表。

svnserve的第二个选项是做为独立“守护”进程,为此要使用-d选项:

$ svnserve -d
$ # svnserve is now running, listening on port 3690

当以守护模式运行svnserve时,你能够使用--listen-port=--listen-host=选项来自定义“绑定”的端口和主机名。

也一直有第三种方式,使用-t选项的“管道模式”,这个模式假定一个分布式服务程序如RSHSSH已经验证了一个用户,而且以这个用户调用了一个私有svnserve进程,svnserve运做如常(经过stdinstdout通信),而且能够设想通信是自动转向到一种通道传递回客户端,当svnserve被这样的通道代理调用,肯定认证用户对版本数据库有彻底的读写权限,(见服务器和访问许可:一个警告。)这与本地用户经过file:///URl访问版本库一样重要。

一旦svnserve已经运行,它会将你系统中全部版本库发布到网络,一个客户端须要指定版本库在URL中的绝对路径,举个例子,若是一个版本库是位于/usr/local/repositories/project1,则一个客户端能够使用svn://host.example.com/usr/local/repositories/project1 来进行访问,为了提升安全性,你能够使用svnserve-r选项,这样会限制只输出指定路径下的版本库:

$ svnserve -d -r /usr/local/repositories

使用-r能够有效地改变文件系统的根位置,客户端能够使用去掉前半部分的路径,留下的要短一些的(更加有提示性)URL:

$ svn checkout svn://host.example.com/project1

若是一个客户端链接到svnserve进程,以下事情会发生:

  • 客户端选择特定的版本库。

  • 服务器处理版本库的conf/svnserve.conf文件,而且执行里面定义的全部认证和受权政策。

  • 依赖于位置和受权政策,

    • 若是没有收到认证请求,客户端可能被容许匿名访问,或者

    • 客户端收到认证请求,或者

    • 若是操做在“通道模式”,客户端会宣布本身已经在外部获得认证。

在撰写本文时,服务器还只知道怎样发送CRAM-MD5[24]认证请求,本质上讲,就是服务器发送一些数据到客户端,客户端使用MD5哈希算法建立这些数据组合密码的指纹,而后返回指纹,服务器执行一样的计算而且来计算结果的一致性,真正的密码并无在互联网上传递。

固然也有可能,若是客户端在外部经过通道代理认证,如SSH,在那种状况下,服务器简单的检验做为那个用户的运行,而后使用它做为认证用户名,更多信息请看“SSH认证和受权”一节

像你已经猜想到的,版本库的svnserve.conf文件是控制认证和受权政策的中央机构,这文件与其它配置文件格式相同(见“运行配置区”一节):小节名称使用方括号标记([]),注释以井号(#)开始,每一小节都有一些参数能够设置(variable = value),让咱们浏览这个文件而且学习怎样使用它们。

此时,svnserve.conf文件的[general]部分包括全部你须要的变量,开始先定义一个保存用户名和密码的文件和一个认证域:

[general]
password-db = userfile
realm = example realm

realm是你定义的名称,这告诉客户端链接的“认证命名空间”,Subversion会在认证提示里显示,而且做为凭证缓存(见“客户端凭证缓存”一节。)的关键字(还有服务器的主机名和端口),password-db参数指出了保存用户和密码列表文件,这个文件使用一样熟悉的格式,举个例子:

[users]
harry = foopassword
sally = barpassword

password-db的值能够是用户文件的绝对或相对路径,对许多管理员来讲,把文件保存在版本库conf/下的svnserve.conf旁边是一个简单的方法。另外一方面,可能你的多个版本库使用同一个用户文件,此时,这个文件应该在更公开的地方,版本库分享用户文件时必须配置为相同的域,由于用户列表本质上定义了一个认证域,不管这个文件在哪里,必须设置好文件的读写权限,若是你知道运行svnserve的用户,限定这个用户对这个文件有读权限是必须的。

svnserve.conf有两个或多个参数须要设置:它们肯定未认证(匿名)和认证用户能够作的事情,参数anon-accessauth-access能够设置为noneread或者write,设置为none会限制全部方式的访问,read容许只读访问,而write容许对版本库彻底的读/写权限:

[general]
password-db = userfile
realm = example realm

# anonymous users can only read the repository
anon-access = read

# authenticated users can both read and write
auth-access = write

实例中的设置其实是参数的缺省值,你必定不要忘了设置它们,若是你但愿更保守一点,你能够彻底封锁匿名访问:

[general]
password-db = userfile
realm = example realm

# anonymous users aren't allowed
anon-access = none

# authenticated users can both read and write
auth-access = write

注意svnserve只能识别“总体”的访问控制,一个用户能够有全体的读/写权限,或者只读权限,或没有访问权限,没有对版本库具体路径访问的细节控制,不少项目和站点,这种 访问控制已经彻底足够了,然而,若是你但愿单个目录访问控制,你会须要使用包括mod_authz_svn(见“每目录访问控制”一节)的Apache,或者是使用pre-commit钩子脚原本控制写访问(见“钩子脚本”一节),Subversion的分发版本包含一个commit-access-control.pl和一个更加复杂的svnperms.py脚本能够做为pre-commit脚本使用。

svnserve的内置认证会很是容易获得,由于它避免了建立真实的系统账号,另外一方面,一些管理员已经建立好了SSH认证框架,在这种状况下,全部的项目用户已经拥有了系统账号和有能力“SSH到”服务器。

SSH与svnserve结合很简单,客户端只须要使用svn+ssh://的URL模式来链接:

$ whoami
harry

$ svn list svn+ssh://host.example.com/repos/project
harry@host.example.com's password: *****

foo
bar
baz

在这个例子里,Subversion客户端会调用一个ssh进程,链接到host.example.com,使用用户harry认证,而后会有一个svnserve私有进程以用户harry运行。svnserve是以管道模式调用的(-t),它的网络协议是经过ssh封装的”,被管道代理的svnserve会知道程序是以用户harry运行的,若是客户执行一个提交,认证的用户名会做为版本的参数保存到新的修订本。

这里要理解的最重要的事情是Subversion客户端是链接到运行中的svnserve守护进程,这种访问方法不须要一个运行的守护进程,也不须要在必要时唤醒一个,它依赖于ssh来发起一个svnserve进程,而后网络断开后终止进程。

当使用svn+ssh://的URL访问版本库时,记住是ssh提示请求认证,而svn客户端程序。这意味着密码不会有自动缓存(见“客户端凭证缓存”一节),Subversion客户端一般会创建多个版本库的链接,但用户一般会由于密码缓存特性而没有注意到这一点,当使用svn+ssh://的URL时,用户会为ssh在每次创建链接时重复的询问密码感到讨厌,解决方案是用一个独立的SSH密码缓存工具,像类Unix系统的ssh-agent或者是Windows下的pageant

当在一个管道上运行时,认证一般是基于操做系统对版本库数据库文件的访问控制,这同Harry直接经过file:///的URL直接访问版本库很是相似,若是有多个系统用户要直接访问版本库,你会但愿将他们放到一个常见的组里,你应该当心的使用umasks。(肯定要阅读“支持多种版本库访问方法”一节)可是即便是在管道模式时,文件svnserve.conf仍是能够阻止用户访问,如auth-access = read或者auth-access = none

你会认为SSH管道的故事该结束了,但还不是,Subversion容许你在运行配置文件config(见“运行配置区”一节)建立一个自定义的管道行为方式,举个例子,假定你但愿使用RSH而不是SSH,在config文件的[tunnels]部分做以下定义:

[tunnels]
rsh = rsh

如今你能够经过指定与定义匹配的URL模式来使用新的管道定义:svn+rsh://host/path。当使用新的URL模式时,Subversion客户端实际上会在后台运行rsh host svnserve -t这个命令,若是你在URL中包括一个用户名(例如,svn+rsh://username@host/path),客户端也会在本身的命令中包含这部分(rsh username@host svnserve -t),可是你能够定义比这个更加智能的新的管道模式:

[tunnels]
joessh = $JOESSH /opt/alternate/ssh -p 29934

这个例子里论证了一些事情,首先,它展示了如何让Subversion客户端启动一个特定的管道程序(这个在/opt/alternate/ssh),在这个例子里,使用svn+joessh://的URL会以-p 29934参数调用特定的SSH程序—对链接到非标准端口的程序很是有用。

第二点,它展现了怎样定义一个自定义的环境变量来覆盖管道程序中的名字,设置SVN_SSH环境变量是覆盖缺省的SSH管道的一种简便方法,可是若是你须要为多个服务器作出多个不一样的覆盖,或许每个都联系不一样的端口或传递不一样的SSH选项,你能够使用本例论述的机制。如今若是咱们设置JOESSH环境变量,它的值会覆盖管道中的变量值—会执行$JOESSH而不是/opt/alternate/ssh -p 29934

不只仅是能够控制客户端调用ssh方式,也能够控制服务器中的sshd的行为方式,在本小节,咱们会展现怎样控制sshd执行svnserve,包括如何让多个用户分享同一个系统账户。

做为开始,定位到你启动svnserve的账号的主目录,肯定这个帐户已经安装了一套SSH公开/私有密钥对,用户能够经过公开密钥认证,由于全部以下的技巧围绕着使用SSHauthorized_keys文件,密码认证在这里不会工做。

若是这个文件还不存在,建立一个authorized_keys文件(在UNIX下一般是~/.ssh/authorized_keys),这个文件的每一行描述了一个容许链接的公钥,这些行一般是下面的形式:

  ssh-dsa AAAABtce9euch.... user@example.com

第一个字段描述了密钥的类型,第二个字段是未加密的密钥自己,第三个字段是注释。然而,这是一个不多人知道的事实,能够使用一个command来处理整行:

  command="program" ssh-dsa AAAABtce9euch.... user@example.com

command字段设置后,SSH守护进程运行命名的程序而不是一般Subversion客户端询问的svnserve -t。这为实施许多服务器端技巧开启了大门,在下面的例子里,咱们简写了文件的这些行:

  command="program" TYPE KEY COMMENT

由于咱们能够指定服务器端执行的命令,咱们很容易来选择运行一个特定的svnserve程序来而且传递给它额外的参数:

  command="/path/to/svnserve -t -r /virtual/root" TYPE KEY COMMENT

在这个例子里,/path/to/svnserve也许会是一个svnserve程序的包裹脚本,会来设置umask(见“支持多种版本库访问方法”一节)。它也展现了怎样在虚拟根目录定位一个svnserve,就像咱们常常在使用守护进程模式下运行svnserve同样。这样作不只能够把访问限制在系统的一部分,也能够使用户不须要在svn+ssh://URL里输入绝对路径。

多个用户也能够共享同一个账号,做为为每一个用户建立系统账户的替代,咱们建立一个公开/私有密钥对,而后在authorized_users文件里放置各自的公钥,一个用户一行,使用--tunnel-user选项:

  command="svnserve -t --tunnel-user=harry" TYPE1 KEY1 harry@example.com
command="svnserve -t --tunnel-user=sally" TYPE2 KEY2 sally@example.com

这个例子容许Harry和Sally经过公钥认证链接同一个的帐户,每一个人自定义的命令将会执行。--tunnel-user选项告诉svnserve -t命令采用命名的参数做为通过认证的用户,若是没有--tunnel-user,全部的提交会做为共享的系统账户提交。

最后要当心:设定经过公钥共享帐户进行用户访问时还会容许其它形式的SSH访问,即便你设置了authorized_keyscommand值,举个例子,用户仍然能够经过SSH获得shell访问,或者是经过服务器执行X11或者是端口转发。为了给用户尽量少的访问权限,你或许但愿在command命令以后指定一些限制选项:

  command="svnserve -t --tunnel-user=harry",no-port-forwarding,/
no-agent-forwarding,no-X11-forwarding,no-pty /
TYPE1 KEY1 harry@example.com

Apache的HTTP服务器是一个Subversion能够利用的“重型”网络服务器,经过一个自定义模块,httpd可让Subversion版本库经过WebDAV/DeltaV协议在客户端前可见,WebDAV/DeltaV协议是HTTP 1.1的扩展(见http://www.webdav.org/来 查看详细信息)。这个协议利用了无处不在的HTTP协议是广域网的核心这一点,添加了写能力—更明确一点,版本化的写—能力。结果就是这样一个标准化的健 壮的系统,做为Apache 2.0软件的一部分打包,被许多操做系统和第三方产品支持,网络管理员也不须要打开另外一个自定义端口。 [25]这样一个Apache-Subversion服务器具有了许多svnserve没有的特性,可是也有一点难于配置,灵活一般会带来复杂性。

下面的讨论包括了对Apache配置指示的引用,给了一些使用这些指示的例子,详细地描述不在本章的范围以内,Apache小组维护了完美的文档,公开存放在他们的站点http://httpd.apache.org。例如,一个通常的配置参考位于 http://httpd.apache.org/docs-2.0/mod/directives.html

一样,当你修改你的Apache设置,颇有可能会出现一些错误,若是你还不熟悉Apache的日志子系统,你必定须要认识到这一点。在你的文件httpd.conf里会指定Apache生成的访问和错误日志(CustomLogErrorLog指示)的磁盘位置。Subversion的mod_dav_svn使用Apache的错误日志接口,你能够浏览这个文件的内容查看信息来查找难于发现的问题根源。

为了让你的版本库使用HTTP网络,你基本上须要两个包里的四个部分。你须要Apache httpd 2.0和包括的mod_dav DAV模块,Subversion和与之一同分发的mod_dav_svn文件系统提供者模块,若是你有了这些组件,网络化你的版本库将很是简单,如:

  • 配置好httpd 2.0,而且使用mod_dav启动,

  • 为mod_dav安装mod_dav_svn插件,它会使用Subversion的库访问版本库,而且

  • 配置你的httpd.conf来输出(或者说暴露)版本库。

你能够经过从源代码编译httpd和Subversion来完成前两个项目,也能够经过你的系统上的已经编译好的二进制包来安装。最新的使用Apache HTTP的Subversion的编译方法和Apache的配置方式能够看Subversion源代码树根目录的INSTALL文件。

一旦你安装了必须的组件,剩下的工做就是在httpd.conf里配置Apache,使用LoadModule来加载mod_dav_svn模块,这个指示必须先与其它Subversion相关的其它配置出现,若是你的Apache使用缺省布局安装,你的mod_dav_svn模块必定在Apache安装目录(一般是在/usr/local/apache2)的modules子目录,LoadModule指示的语法很简单,影射一个名字到它的共享库的物理位置:

LoadModule dav_svn_module     modules/mod_dav_svn.so

注意,若是mod_dav是做为共享对象编译(而不是静态连接到httpd程序),你须要为它使用使用LoadModule语句,必定肯定它在mod_dav_svn以前:

LoadModule dav_module         modules/mod_dav.so
LoadModule dav_svn_module modules/mod_dav_svn.so

在你的配置文件后面的位置,你须要告诉Apache你在什么地方保存Subversion版本库(也许是多个),位置指示有一个很像XML的符号,开始于一个开始标签,以一个结束标签结束,配合中间许多的其它配置。Location指 示的目的是告诉Apache在特定的URL以及子URL下须要特殊的处理,若是是为Subversion准备的,你但愿能够经过告诉Apache特定 URL是指向版本化的资源,从而把支持转交给DAV层,你能够告诉Apache将全部路径部分(URL中服务器名称和端口以后的部分)以/repos/开头的URL交由DAV服务提供者处理。一个DAV服务提供者的版本库位于/absolute/path/to/repository,能够使用以下的httpd.conf语法:

<Location /repos>
DAV svn
SVNPath /absolute/path/to/repository
</Location>

若是你计划支持多个具有相同父目录的Subversion版本库,你有另外的选择,SVNParentPath指示,来表示共同的父目录。举个例子,若是你知道你会在/usr/local/svn下建立多个Subversion版本库,而且经过相似http://my.server.com/svn/repos1http://my.server.com/svn/repos2的URL访问,你能够用后面例子中的httpd.conf配置语法:

<Location /svn>
DAV svn

# any "/svn/foo" URL will map to a repository /usr/local/svn/foo
SVNParentPath /usr/local/svn
</Location>

使用上面的语法,Apache会代理全部URL路径部分为/svn/的请求到Subversion的DAV提供者,Subversion会认为SVNParentPath指定的目录下的全部项目是真实的Subversion版本库,这一般是一个便利的语法,不像是用SVNPath指示,咱们在此没必要为建立新的版本库而重启Apache。

请肯定当你定义新的位置,不会与其它输出的位置重叠,例如你的主要DocumentRoot/www,不要把Subversion版本库输出到<Location /www/repos>,若是一个请求的URI是/www/repos/foo.c,Apache不知道是直接到repos/foo.c访问这个文件仍是让mod_dav_svn代理从Subversion版本库返回foo.c

在 本阶段,你必定要考虑访问权限问题,若是你已经做为普通的web服务器运行过Apache,你必定有了一些内容—网页、脚本和其余。这些项目已经配置了许 多在Apache下能够工做的访问许可,或者更准确一点,容许Apache与这些文件一块儿工做。Apache看成为Subversion服务器运行时,同 样须要正确的访问许可来读写你的Subversion版本库。(见服务器和访问许可:一个警告。)

你会须要检验权限系统的设置知足Subversion的需求,同时不会把之前的页面和脚本搞乱。这或许意味着修改Subversion的访问许可来配合Apache服务器已经使用的工具,或者可能意味着须要使用httpd.confUserGroup指示来指定Apache做为运行的用户和Subversion版本库的组。并非只有一条正确的方式来设置许可,每一个管理员都有不一样的缘由来以特定的方式操做,只须要意识到许可关联的问题常常在为Apache配置Subversion版本库的过程当中被疏忽。

此时,若是你配置的httpd.conf保存以下的内容

<Location /svn>
DAV svn
SVNParentPath /usr/local/svn
</Location>

这样你的版本库对全世界是能够“匿名”访问的,直到你配置了一些认证受权政策,你经过Location指示来使Subversion版本库能够被任何人访问,换句话说,

  • 任何人能够使用Subversion客户端来从版本库URL取出一个工做拷贝(或者是它的子目录),

  • 任何人能够在浏览器输入版本库URL交互浏览的方式来查看版本库的最新修订版本,而且

  • 任何人能够提交到版本库。

最简单的客户端认证方式是经过HTTP基本认证机制,简单的使用用户名和密码来验证一个用户所自称的身份,Apache提供了一个htpasswd工具来管理可接受的用户名和密码,这些就是你但愿赋予Subversion特别权限的用户,让咱们给Sally和Harry赋予提交权限,首先,咱们须要添加他们到密码文件。

$ ### First time: use -c to create the file
$ ### Use -m to use MD5 encryption of the password, which is more secure
$ htpasswd -cm /etc/svn-auth-file harry
New password: *****
Re-type new password: *****
Adding password for user harry
$ htpasswd -m /etc/svn-auth-file sally
New password: *******
Re-type new password: *******
Adding password for user sally
$

下一步,你须要在httpd.confLocation区里添加一些指示来告诉Apache如何来使用这些密码文件,AuthType指示指定系统使用的认证类型,这种状况下,咱们须要指定Basic认证系统,AuthName是你提供给认证域一个任意名称,大多数浏览器会在向用户询问名称和密码的弹出窗口里显示这个名称,最终,使用AuthUserFile指示来指定使用htpasswd建立的密码文件的位置。

添加完这三个指示,你的<Location>区块必定像这个样子:

<Location /svn>
DAV svn
SVNParentPath /usr/local/svn
AuthType Basic
AuthName "Subversion repository"
AuthUserFile /etc/svn-auth-file
</Location>

这个<Location>区块尚未结束,还不能作任何有用的事情,它只是告诉Apache当须要受权时,要去向Subversion客户端索要用户名和密码。咱们这里遗漏的,是一些告诉Apache什么样客户端须要受权的指示。哪里须要受权,Apache就会在哪里要求认证,最简单的方式是保护全部的请求,添加Require valid-user来告诉Apache任何请求须要认证的用户:

<Location /svn>
DAV svn
SVNParentPath /usr/local/svn
AuthType Basic
AuthName "Subversion repository"
AuthUserFile /etc/svn-auth-file
Require valid-user
</Location>

必定要阅读后面的部分(“受权选项”一节)来获得Require的细节,和受权政策的其余设置方法。

须要警戒:HTTP基本认证的密码是用明文传输,所以很是不可靠的,若是你担忧密码偷窥,最好是使用某种SSL加密,因此客户端认证使用https://而不是http://,为了方便,你能够配置Apache为自签名认证。 [26] 参考Apache的文档(和OpenSSL文档)来查看怎样作。

商业应用须要越过公司防火墙的版本库访问,防火墙须要当心的考虑非认证用户“吸收”他们的网络流量的状况,SSL让那种形式的关注更不容易致使敏感数据泄露。

若是Subversion使用OpenSSL编译,它就会具有与Subversion服务器使用https://的URL通信的能力,Subversion客户端使用的Neon库不只仅能够用来验证服务器证书,也能够必要时提供客户端证书,若是客户端和服务器交换了SSL证书而且成功地互相认证,全部剩下的交流都会经过一个会话关键字加密。

怎样产生客户端和服务器端证书以及怎样使用它们已经超出了本书的范围,许多书籍,包括Apache本身的文档,描述这个任务,如今咱们能够覆盖的是普通的客户端怎样来管理服务器与客户端证书。

当经过https://与Apache通信时,一个Subversion客户端能够接收两种类型的信息:

  • 一个服务器证书

  • 一个客户端证书的要求

若是客户端接收了一个服务器证书,它须要去验证它是能够相信的:这个服务器是它自称的那一个吗?OpenSSL库会去检验服务器证书的签名人或者是核证机构(CA)。若是OpenSSL不能够自动信任这个CA,或者是一些其余的问题(如证书过时或者是主机名不匹配),Subversion命令行客户端会询问你是否愿意仍然信任这个证书:

$ svn list https://host.example.com/repos/project

Error validating server certificate for 'https://host.example.com:443':
- The certificate is not issued by a trusted authority. Use the
fingerprint to validate the certificate manually!
Certificate information:
- Hostname: host.example.com
- Valid: from Jan 30 19:23:56 2004 GMT until Jan 30 19:23:56 2006 GMT
- Issuer: CA, example.com, Sometown, California, US
- Fingerprint: 7d:e1:a9:34:33:39:ba:6a:e9:a5:c4:22:98:7b:76:5c:92:a0:9c:7b

(R)eject, accept (t)emporarily or accept (p)ermanently?

这个对话看起来很熟悉,这是你会在web浏览器(另外一种HTTP客户端,就像Subversion)常常看到的问题,若是你选择(p)ermanent选项,服务器证书会存放在你存放那个用户名和密码缓存(见“客户端凭证缓存”一节。)的私有运行区auth/中,缓存后,Subversion会自动记住在之后的交流中信任这个证书。

你的运行中servers文件也会给你能力可让Subversion客户端自动信任特定的CA,包括全局的或是每主机为基础的,只须要设置ssl-authority-files为一组逗号隔开的PEM加密的CA证书列表:

[global]
ssl-authority-files = /path/to/CAcert1.pem;/path/to/CAcert2.pem

许多OpenSSL安装包括一些预先定义好的能够广泛信任的“缺省的”CA,为了让Subversion客户端自动信任这些标准权威,设置ssl-trust-default-catrue

当 与Apache通话时,Subversion客户端也会收到一个证书的要求,Apache是询问客户端来证实本身的身份:这个客户端是不是他所说的那一 个?若是一切正常,Subversion客户端会发送回一个经过Apache信任的CA签名的私有证书,一个客户端证书一般会以加密方式存放在磁盘,使用 本地密码保护,当Subversion收到这个要求,它会询问你证书的路径和保护用的密码:

$ svn list https://host.example.com/repos/project

Authentication realm: https://host.example.com:443
Client certificate filename: /path/to/my/cert.p12
Passphrase for '/path/to/my/cert.p12': ********

注意这个客户端证书是一个“p12”文件,为了让Subversion使用客户端证书,它必须是运输标准的PKCS#12格式,大多数浏览器能够导入和导出这种格式的证书,另外一个选择是用OpenSSL命令行工具来转化存在的证书为PKCS#12格式。

再次,运行中servers文件容许你为每一个主机自动响应这种要求,单个或两条信息能够用运行参数来描述:

[groups]
examplehost = host.example.com

[examplehost]
ssl-client-cert-file = /path/to/my/cert.p12
ssl-client-cert-password = somepassword

一旦你设置了ssl-client-cert-filessl-client-cert-password参数,Subversion客户端能够自动响应客户端证书请求而不会打扰你。 [27]

此刻,你已经配置了认证,可是没有配置受权,Apache能够要求用户认证而且肯定身份,可是并无说明这个身份的怎样容许和限制,这个部分描述了两种控制访问版本库的策略。

最简单的访问控制形式是受权特定用户为只读版本库访问或者是读/写访问版本库。

你能够经过在<Location>区块添加Require valid-user指示来限制全部的版本库操做,使用咱们前面的例子,这意味着只有客户端只能够是harry或者sally,并且他们必须提供正确的用户名及对应密码,这样容许对Subversion版本库作任何事:

<Location /svn>
DAV svn
SVNParentPath /usr/local/svn

# how to authenticate a user
AuthType Basic
AuthName "Subversion repository"
AuthUserFile /path/to/users/file

# only authenticated users may access the repository
Require valid-user
</Location>

有时候,你不须要这样严密,举个例子,Subversion本身在http://svn.collab.net/repos/svn的源代码容许全世界的人执行版本库的只读操做(例如检出咱们的工做拷贝和使用浏览器浏览版本库),可是限定只有认证用户能够执行写操做。为了执行特定的限制,你能够使用LimitLimitExcept配置指示,就像Location指示,这个区块有开始和结束标签,你须要在<Location>中添加这个指示。

LimitLimitExcept中使用的参数是能够被这个区块影响的HTTP请求类型,举个例子,若是你但愿禁止全部的版本库访问,只是保留当前支持的只读操做,你能够使用LimitExcept指示,而且使用GETPROPFINDOPTIONSREPORT请求类型参数,而后前面提到过的Require valid-user指示将会在<LimitExcept>区块中而不是在<Location>区块。

<Location /svn>
DAV svn
SVNParentPath /usr/local/svn

# how to authenticate a user
AuthType Basic
AuthName "Subversion repository"
AuthUserFile /path/to/users/file

# For any operations other than these, require an authenticated user.
<LimitExcept GET PROPFIND OPTIONS REPORT>
Require valid-user
</LimitExcept>
</Location>

这里只是一些简单的例子,想看关于Apache访问控制Require指示的更深刻信息,能够查看Apache文档中的教程集http://httpd.apache.org/docs-2.0/misc/tutorials.html中的Security部分。

也能够使用Apache的httpd模块mod_authz_svn更加细致的设置访问权限,这个模块收集客户端传递过来的不一样的晦涩的URL信息,询问mod_dav_svn来解码,而后根据在配置文件定义的访问政策来裁决请求。

若是你从源代码建立Subversion,mod_authz_svn会自动附加到mod_dav_svn,许多二进制分发版本也会自动安装,为了验证它是安装正确,肯定它是在httpd.confLoadModule指示中的mod_dav_svn后面:

LoadModule dav_module         modules/mod_dav.so
LoadModule dav_svn_module modules/mod_dav_svn.so
LoadModule authz_svn_module modules/mod_authz_svn.so

为了激活这个模块,你须要配置你的Location区块的AuthzSVNAccessFile指示,指定保存路径中的版本库访问政策的文件。(一下子咱们将会讨论这个文件的格式。)

Apache很是的灵活,你能够从三种模式里选择一种来配置你的区块,做为开始,你选择一种基本的配置模式。(下面的例子很是简单;见Apache本身的文档中的认证和受权选项来查看更多的细节。)

最简单的区块是容许任何人能够访问,在这个场景里,Apache决不会发送认证请求,全部的用户做为“匿名”对待。

例 6.1. 匿名访问的配置实例。

<Location /repos>
DAV svn
SVNParentPath /usr/local/svn

# our access control policy
AuthzSVNAccessFile /path/to/access/file
</Location>

在另外一个极端,你能够配置为拒绝全部人的认证,全部客户端必须提供证实本身身份的证书,你经过Require valid-user指示来阻止无条件的认证,而且定义一种认证的手段。

例 6.2. 一个认证访问的配置实例。

<Location /repos>
DAV svn
SVNParentPath /usr/local/svn

# our access control policy
AuthzSVNAccessFile /path/to/access/file

# only authenticated users may access the repository
Require valid-user

# how to authenticate a user
AuthType Basic
AuthName "Subversion repository"
AuthUserFile /path/to/users/file
</Location>

第 三种流行的模式是容许认证和匿名用户的组合,举个例子,许多管理员但愿容许匿名用户读取特定的版本库路径,但但愿只有认证用户能够读(或者写)更多敏感的 区域,在这个设置里,全部的用户开始时用匿名用户访问版本库,若是你的访问控制策略在任什么时候候要求一个真实的用户名,Apache将会要求认证客户端,为 ­¤,你能够同时使用Satisfy AnyRequire valid-user指示。

例 6.3. 一个混合认证/匿名访问的配置实例。

<Location /repos>
DAV svn
SVNParentPath /usr/local/svn

# our access control policy
AuthzSVNAccessFile /path/to/access/file

# try anonymous access first, resort to real
# authentication if necessary.
Satisfy Any
Require valid-user

# how to authenticate a user
AuthType Basic
AuthName "Subversion repository"
AuthUserFile /path/to/users/file
</Location>

一旦你的基本Location区块已经配置了,你能够建立一个定义一些受权规则的访问文件。

访问文件的语法与svnserve.conf和运行中配置文件很是类似,以(#)开头的行会被忽略,在它的简单形式里,每一小节命名一个版本库和一个里面的路径,认证用户名是在每一个小节中的选项名,每一个选项的值描述了用户访问版本库的级别:r(只读)或者rw(读写),若是用户没有提到,访问是不容许的。

具体一点:这个小节的名称是[repos-name:path]或者[path]的形式,若是你使用SVNParentPath指示,指定版本库的名字是很重要的,若是你漏掉了他们,[/some/dir]部分就会与/some/dir的全部版本库匹配,若是你使用SVNPath指示,所以在你的小节中只是定义路径也很好—毕竟只有一个版本库。

[calc:/branches/calc/bug-142]
harry = rw
sally = r

在第一个例子里,用户harrycalc版本库中/branches/calc/bug-142具有彻底的读写权利,可是用户sally只有读权利,任何其余用户禁止访问这个目录。

固然,访问控制是父目录传递给子目录的,这意味着咱们能够为Sally指定一个子目录的不一样访问策略:

[calc:/branches/calc/bug-142]
harry = rw
sally = r

# give sally write access only to the 'testing' subdir
[calc:/branches/calc/bug-142/testing]
sally = rw

如今Sally能够读取分支的testing子目录,但对其余部分仍是只能够读,同时,Harry对整个分支还继续有彻底的读写权限。

也能够经过继承规则明确的的拒绝某人的访问,只须要设置用户名参数为空:

[calc:/branches/calc/bug-142]
harry = rw
sally = r

[calc:/branches/calc/bug-142/secret]
harry =

在这个例子里,Harry对bug-142目录树有彻底的读写权限,可是对secret子目录没有任何访问权利。

有一件事须要记住的是须要找到最匹配的目录,mod_authz_svn模块首先找到匹配本身的目录,而后父目录,而后父目录的父目录,就这样继续下去,更具体的路径控制会覆盖全部继承下来的访问控制。

缺省状况下,没有人对版本库有任何访问,这意味着若是你已经从一个空文件开始,你会但愿给全部用户对版本库根目录具有读权限,你能够使用*实现,用来表明“全部用户”:

[/]
* = r

这是一个普通的设置;注意在小节名中没有提到版本库名称,这让全部版本库对全部的用户可读,无论你是使用SVNPath或是SVNParentPath。当全部用户对版本库有了读权利,你能够赋予特定用户对特定子目录的rw权限。

星号(*)参数须要在这里详细强调:这是匹配匿名用户的惟一模式,若是你已经配置了你的Location区块容许匿名和认证用户的混合访问,全部用户做为Apache匿名用户开始访问,mod_authz_svn会在要访问路径的定义中查找*值;若是找不到,Apache就会要求真实的客户端认证。

访问文件也容许你定义一组的用户,很像Unix的/etc/group文件:

[groups]
calc-developers = harry, sally, joe
paint-developers = frank, sally, jane
everyone = harry, sally, joe, frank, sally, jane

组能够被赋予通用户同样的访问权限,使用“at”(@)前缀来加以区别:

[calc:/projects/calc]
@calc-developers = rw

[paint:/projects/paint]
@paint-developers = rw
jane = r

组中也能够定义为包含其它的组:

[groups]
calc-developers = harry, sally, joe
paint-developers = frank, sally, jane
everyone = @calc-developers, @paint-developers

...而且很是接近。

mod_dav_svn模块作了许多工做来肯定你标记为“不可读”的数据不会因意外而泄露,这意味着须要紧密监控经过svn checkout或是svn update返回的路径和文件内容,若是这些命令遇到一些根据认证策略不是可读的路径,这个路径一般会被一块儿忽略,在历史或者重命名操做时—例如运行一个相似svn cat -r OLD foo.c的命令来操做一个好久之前改过名字的文件 — 若是一个对象的之前的名字检测到是只读的,重命令追踪就会终止。

全部的路径检查在有时会很是昂贵,特别是svn log的状况。当检索一列修订版本时,服务器会查看全部修订版本修改的路径,而且检查可读性,若是发现了一个不可读路径,它会从修订版本的修改路径中忽略(能够查看--verbose选项),而且整个的日志信息会被禁止,没必要多说,这种影响大量文件修订版本的操做会很是耗时。这是安全的代价:即便你并无配置mod_authz_svn模块,mod_dav_svn仍是会询问httpd来对全部路径运行认证检查,mod_dav_svn模块没有办法知道那个认证模块被安装,因此只有询问Apache来调用所提供的模块。

在另外一方面,也有一个安全舱门容许你用安全特性来交换速度,若是你不是坚持要求有每目录受权(如不使用 mod_authz_svn和相似的模块),你就能够关闭全部的路径检查,在你的httpd.conf文件,使用SVNPathAuthz指示:

例 6.4. 关闭全部的路经检查

<Location /repos>
DAV svn
SVNParentPath /usr/local/svn

SVNPathAuthz off
</Location>

SVNPathAuthz指示缺省是“on”,当设置为“off”时,全部的路径为基础的受权都会关闭;mod_dav_svn中止对每一个目录调用受权检查。

咱们已经覆盖了关于认证和受权的Apache和mod_dav_svn的大多数选项,可是Apache还提供了许多很好的特性。

一 个很是有用的好处是使用Apache/WebDAV配置Subversion版本库时能够用普通的浏览器察看最新的版本库文件,由于Subversion 使用URL来鉴别版本库版本化的资源,版本库使用的HTTP为基础的URL也能够直接输入到Web浏览器中,你的浏览器会发送一个GET请求到URL,根据访问的URL是指向一个版本化的目录仍是文件,mod_dav_svn会负责列出目录列表或者是文件内容。

因 为URL不能肯定你所但愿看到的资源的版本,mod_dav_svn会一直返回最新的版本,这样会有一些美妙的反作用,你能够直接把Subversion 的URL传递给文档做为引用,这些URL会一直指向文档最新的材料,固然,你也能够在别的网站做为超链使用这些URL。

你 一般会在版本化的文件的URL以外获得更多地用处—毕竟那里是有趣的内容存在的地方,可是你会偶尔浏览一个Subversion的目录列表,你会很快发现 展现列表生成的HTML很是基本,而且必定没有在外观上(或者是有趣上)下功夫,为了自定义这些目录显示,Subversion提供了一个XML目录特 性,一个单独的SVNIndexXSLT指示在你的httpd.conf文件版本库的Location块里,它将会指导mod_dav_svn在显示目录列表的时候生成XML输出,而且引用你选择的XSLT样式表文件:

<Location /svn>
DAV svn
SVNParentPath /usr/local/svn
SVNIndexXSLT "/svnindex.xsl"

</Location>

使用SVNIndexXSLT指示和建立一个XSLT样式表,你可让你的目录列表的颜色模式与你的网站的其它部分匹配,不然,若是你愿意,你能够使用Subversion源分发版本中的tools/xslt/目录下的样例样式表。记住提供给SVNIndexXSLT 指示的路径是一个URL路径—浏览器须要阅读你的样式表来利用它们!

Apache做为一个健壮的Web服务器的许多特性也能够用来增长Subversion的功能性和安全性,Subversion使用Neon与Apache通信,这是一种通常的HTTP/WebDAV库,能够支持SSL和Deflate压缩(是gzipPKZIP程序用来“压缩”文件为数据块的同样的算法)之类的机制。你只须要编译你但愿Subversion和Apache须要的特性,而且正确的配置程序来使用这些特性。

Deflate压缩给服务器和客户端带来了更多地负担,压缩和解压缩减小了网络传输的实际文件的大小,若是网络带宽比较紧缺,这种方法会大大提升服务器和客户端之间发送数据的速度,在极端状况下,这种最小化的传输会形成超时和成功的区别。

不 怎么有趣,但一样重要,是Apache和Subversion关系的一些特性,像能够指定自定义的端口(而不是缺省的HTTP的80)或者是一个 Subversion能够被访问的虚拟主机名,或者是经过代理服务器访问的能力,这些特性都是Neon所支持的,因此Subversion轻易获得这些支 持。

最后,由于mod_dav_svn是使用一个半完成的WebDAV/DeltaV方言,因此经过第三方的DAV客户端访问也是可能的,几乎全部的现代操做系统(Win3二、OS X和Linux)都有把DAV服务器影射为普通的网络“共享”的内置能力,这是一个复杂的主题;察看附录 B, WebDAV和自动版本化来获得更多细节。

你已经看到了一个版本库能够用多种方式访问,可是能够—或者说安全的—用几种方式同时并行的访问你的版本库吗?回答是能够,假若你有一些深谋远虑的使用。

在任何给定的时间,这些进程会要求读或者写访问你的版本库:

  • 常规的系统用户使用Subversion客户端(客户端程序自己)经过file:///URL直接访问版本库;

  • 常规的系统用户链接使用SSH调用的访问版本库的svnserve进程(以它们本身运行);

  • 一个svnserve进程—是一个守护进程或是经过inetd启动的—做为一个固定的用户运行;

  • 一个Apache httpd进程,以一个固定用户运行。

最一般的一个问题是管理进入到版本库的全部权和访问许可,是前面例子的全部进程 (或者说是用户)都有读写Berkeley DB的权限?假定你有一个类Unix的操做系统,一个直接的办法是在新的svn组添加全部潜在的用户,而后让这个组彻底拥有版本库,但这样还不足够,由于一个进程会使用不友好的umask来写数据库文件—用来防止别的用户的访问。

因此下一步咱们不选择为每一个版本库用户设置一个共同的组的方法,而是强制每一个版本库访问进程使用一个健全的umask。对直接访问版本库的用户,你能够使用svn的包裹脚原本首先设置umask 002,而后运行真实的svn客户端程序,你能够为svnserve写相同的脚本,而且增长umask 002命令到Apache本身的启动脚本apachectl中。例如:

$ cat /usr/bin/svn

#!/bin/sh

umask 002
/usr/bin/svn-real "$@"

另外一个在类Unix系统下常见的问题是,当版本库在使用时,BerkeleyDB有时候建立一个新的日志文件来记录它的东西,即便这个版本库是彻底由svn组拥有,这个新建立的文件不是必须被同一个组拥有,这给你的用户形成了更多地许可问题。一个好的工做区应该设置组的SUID字节到版本库的db目录,这会致使全部新建立的日志文件拥有同父目录相同的组拥有者。

一旦你跳过了这些障碍,你的版本库必定是能够经过各类可能的手段访问了,这看起来有点凌乱和复杂,可是这个让多个用户分享对一个文件的写权限的问题是一个经典问题,而且常常是没有优雅的解决。

幸运的是,大多数版本库管理员不须要这样复杂的配置,用户若是但愿访问本机的版本库,并非必定要经过file://的URL—他们能够用localhost机器名联系Apache的HTTP服务器或者是svnserve,协议分别是http://svn://。为你的Subversion版本库维护多个服务器进程,版本库会变得超出须要的头痛,咱们建议你选择最符合你的须要的版本库,而且坚持使用!



[22] 这个问题其实是一个FAQ,源自错误的服务器配置。

[23] 再次重申,一个常见的错误是把服务器配置为从不会请求认证,当用户传递--username--password给客户端时,他们惊奇的发现它们没有被使用,如新的修订版本看起来始终是由匿名用户提交的!

[24] 见RFC 2195。

[25] 他们讨厌这样作。