在研究人口遷移方面,中國姓氏有著得天獨厚的優勢。一方面,中國是世界上最早使用姓氏的國家,由于受儒家文化影響,中國人一般不會改姓,這使得中國姓氏的傳遞具有很好的穩定性和可靠性。另一方面,中國地域廣闊,行政區劃層級豐富,具有很好的空間分辨率,特別適合將姓氏分布與地理信息相結合,研究人口遷移的相關問題。
以姓氏分布為基礎,利用不同空間尺度的系統分析,配合運用指標分析、聚類分析、因素分析等社會統計學的研究方法,可以探討與人口遷移相關的許多問題,如大規模的人口遷移事件、地理隔離對群體結構的影響、人口遷移率的計算等,為研究人口遷移問題提供新的視角。
姓氏分布與大規模人口遷移
大規模的人口遷移會增加遷入地的姓氏多樣性,導致遷入地和遷出地的姓氏分布呈現較高的相似性,因此,通過考察不同地區姓氏分布的特點,能夠判斷哪些地區曾發生過大規模的人口遷移,從而為史料中記載的人口遷移事件提供佐證。我們利用全國12.8億人的姓氏數據,根據同姓率和姓氏距離兩個指標,對我國歷史上出現的一些大規模人口遷移事件進行了分析。
同姓率的概念最早由達爾文提出,用來估算近親結婚的比例,其意指是在一個地區隨機選取兩個人,而他們具有相同姓氏的概率。顯然,一個地區的姓氏數量越多,每個姓氏的人數越平均,同姓率就越小,說明該地區有較好的姓氏多樣性,很有可能是人口的遷入地。對比我國的各個地區,可以發現,長江中下游地區有較低的同姓率和很好的姓氏多樣性,這與北宋南宋時期大量移民從黃河流域遷移到長江流域的史實是一致的。相反,在某些比較隔絕的少數民族聚居區,遺傳漂移占主導作用,導致姓氏比較單一,例如甘肅省廣河縣的20多萬人口中有17萬人姓馬,同姓率很高。而同樣是少數民族聚居地的嘉峪關、曲靖等城市,由于歷史上曾經作為物質和文化交流的中心,吸引了大量外來人口,其同姓率比普通城市還低。
姓氏距離是在地區間同姓率的基礎上得到的,反映的是每一個姓氏在不同地區所占人口比例的相似程度,相似性越高,姓氏距離就越小,說明兩地之間可能存在人口遷移。在省級層次上,我們通過聚類分析發現東北三省和山東雖然隔著北京、天津、河北等省份,但他們的姓氏距離卻最小,這反映了“闖關東”的社會移民現象。姓氏距離還能考察城市之間的移民現象,比如新疆石河子市,與中原地區很多城市的姓氏距離遠小于其與周圍地區的姓氏距離,這是因為石河子的大部分人口是來自河南、安徽、陜西、江蘇等地的支邊建設者。
姓氏空間分布與地理隔離
地理隔離是指由于某些地理條件的阻隔而形成的隔離,使生物不能由一個地區自由遷到另一個地區,從而阻止了基因的交流。地理隔離增強了遺傳漂移的作用,不僅導致不同地區的人們在膚色、體質、體貌、血型等生物學方面存在明顯差異,而且促使不同地區形成獨特的觀念、宗教、方言、習俗等文化傳統,這些文化因素進一步阻礙了人口的遷移和交流,使得不同地區占優勢地位的姓氏各有不同,增大了地區間姓氏分布的差異。通過分析姓氏空間分布的特點,能夠探討出我國地理隔離的狀況。
總的來說,姓氏距離一般隨地理距離的增加而增加,兩者存在正相關,而相關性的大小可以反映地理隔離的程度。以美國為例,由于美國社會流動性強且交通便捷,人口遷移率一直處于世界前列,頻繁的人口遷移導致姓氏的空間分布趨于均勻,姓氏距離和地理距離的相關系數只有0.17。而大部分的歐洲國家保持著傳統的定居生活方式,兩者的相關系數基本在0.4以上,德國為0.51,法國達到了0.61。根據2007年的人口姓氏分布數據,在省級層次上,我國地理距離和姓氏距離之間的相關系數為0.64,表現出明顯的地理隔離,反映了我國居民以定居為主的居住習慣。
局部來看,我國不同地區的地理隔離程度也存在明顯差異,這可以通過分析一個地區與周圍地區姓氏距離和地理距離的關系來考察。分析表明:北方的大部分城市,與周圍城市的姓氏距離都很小,以北京為例,在其周圍800公里的范圍內,姓氏距離基本沒有明顯變化,超過1000公里才有明顯增加,這說明北方地區的地理隔離不顯著。而以福建、廣東為代表的大部分南方城市則大不相同,姓氏距離隨地理距離的增長很快,說明這些地區的地理隔離十分顯著。
繪制某個城市與周圍城市之間姓氏距離與空間距離的關系曲線,根據曲線的均值、斜率、轉折點等可以對城市的聚居程度、隔離程度、遷移半徑等給出定量化的描述,有利于我們更加全面地刻畫城市的遷移特征。根據城市之間的姓氏距離,可以進一步探測中國人口的地理隔離邊界,并尋找引起地理隔離的自然人文因素,能夠為區域邊界的劃分、民族政策的制定以及社會治理方案的提出提供科學依據。
姓氏分布變化與人口遷移率的計算
隨著科技的進步與社會經濟的發展,人口流動越來越頻繁,但地區間人口遷移率的計算尤其是長時期內人口遷移率的估算卻比較困難,主要原因是統計口徑和方法的變化以及歷史數據的缺乏。利用相對容易獲得的姓氏數據,使用一定的統計方法,不僅可以得到每個地區在一段時間內人口遷入和遷出的總量,還可以推斷出遷入人口來自哪里以及遷出的人口去往何處,這不論在人口學還是社會管理領域都具有重要的應用價值。
目前,利用姓氏分布計算人口遷移率基本有兩種方法:一種方法僅僅需要單個時間點的姓氏分布情況,根據中性理論,得到姓氏數量、人口數量、人口遷移率之間的關系,進而計算出地區的人口遷入率。美國科學院院士、著名群體遺傳學家卡瓦利·斯福扎使用這種方法估算了意大利91個省的人口遷入率,和人口普查結果具有明顯相關性。另一種方法是根據兩個時間點各個地區姓氏分布的變化,用統計學方法得到地區間的人口遷移率。利用這一研究線路,卡瓦利·斯福扎計算了撒丁島九個地區之間1871年—1970年間的人口遷移矩陣;還有學者計算了巴黎和周圍某些地區之間的人口遷移率,其結果都與實際數據有很好的對應。
我們利用1982年全國第三次人口普查萬分之五的抽樣數據,以及2007年全國人口的戶籍數據,計算了該時期省際之間的人口遷移率,但結果并不理想,這是因為1982年的數據是由300多個調查點的數據加總而成,而中國人同姓聚居的特點使得每個省十幾個調查點的數據并不能反映真實的姓氏比例。利用我國人口普查的完整數據或者某兩個時間點的各地區的戶籍數據,就能克服因數據抽樣導致的誤差,從而比較準確地計算該時期內地區間的人口遷移率,為我國制定人口政策提供依據。
陳家偉(作者單位:北京師范大學系統科學學院)