Thứ Bảy, 7 tháng 11, 2015

Lý thuyết trò chơi trong tiến hóa

Từ khóa

1.       Lịch sử hình thành

R.A.Fisher được xem là người đầu tiên áp dụng lý thuyết trò chơi vào sinh học tiến hóa (The Genetic Theory of Nature Selection- Tạm dịch “Lý thuyết di truyền của chọn lọc tự nhiên” (1930)), trong công trình của mình, ông đã cố gắng thử giải thích sự cân bằng về tỷ lệ giới tính trong quần thể động vật có vú. Một vấn đề được đặt ra là vì sao tỷ lệ giới tính luôn cân bằng hoặc xấp xỉ vậy, không bao giờ có sự chênh lệch quá lớn về một giới nào đó. Fisher thấy rằng việc tính toán số cá thể trong quần thể phù hợp để thu được con số mong muốn ở đời cháu phụ thuộc rất lớn vào sự phân bố giới tính trong quần thể ban đầu. Khi số lượng cá thể cái trong quần thể tăng mạnh thì kéo theo đó, số lượng cá thể đực cũng tăng cao và ngược lại. Fisher chỉ ra rằng, trong các trường hợp cụ thể, động học tiến hóa (evolutionary dynamics) thường dẫn đến sự cân bằng giới tính. Thực tế cho thấy rằng, sự cân bằng quần thể phụ thuộc rất lớn vào tần số giới tính trong quần thể ban đầu.

Các luận cứ của Fishers cho rằng có thể sử dụng lý thuyết trò chơi để giải thích các vấn đề. Năm 1961, R.C.Lewontin lần đầu áp dụng lý thuyết trò chơi vào sinh học tiến hóa trong công trình “Tiến hóa và các nguyên lý trò chơi”. Năm 1972, Maynard Smith đã đưa ra khái niệm chiến lược tiến hóa bền vững (Evolutionarily stable strategy – ESS) trong công trình “Lý thuyết trò chơi và cuộc chiến sinh tồn” – Game Theory and the Evolution of Fighting. Tuy nhiên, khái niệm này chỉ trở nên phổ biến từ năm 1973, khi công trình Logic các xung đột của động vật (The Logic of Animal Conflict) của Maynard Smith và Price. Sau đó, kể từ năm 1984, với công trình “Sự tiến hóa của hợp tác” (Evolution of Cooperation), Robert Axelrod đã thổi bùng công cuộc nghiên cứu sinh thái và khoa học xã hội dưới góc nhìn của Lý thuyết trò chơi về Tiến hóa.

2    2. Tiếp cận lý thuyết trò chơi trong tiến hóa

Có hai con đường để nghiên cứu lý thuyết trò chơi trong tiến hóa. Cách đầu tiên là đi theo con đường của Maynard Smith và Price với việc sử dụng chiến lược tiến hóa bền vững như một công cụ cơ bản để phân tích. Cách tiếp cận thứ hai là xây dựng một mô hình rõ ràng về sự thay đổi chiến lược trong quần thể và nghiên cứu các đặc điểm của động học tiến hóa theo mô hình tần số đó.

2.1. Tiến hóa bền vững

Như một ví dụ cụ thể về cách tiếp cận đầu tiên, Maynard Smith và Price đã phân tích trò chơi Diều hâu- Bồ câu trong công trình “Logic các xung đột của động vật”. Trong trò chơi này, hai cá thể cạnh tranh nhau về nguồn lợi cố định V và từng cá thể có quyền lựa chọn một trong hai chiến thuật như sau:

Diều hâu: Với tập tính hung hăng sẽ tấn công liên tục cho đến khi một trong hai bên bị thương
Bồ câu: Lập tức rút lui khi đối phương có động thái tấn công

Ta giả sử rằng cả hai cá thể đều chọn lối chơi Diều hâu, kết quả là cả hai bên sẽ chịu một tổn thất tương đương nhau, cái giá phải trả cho cả hai bên có giá trị là C. Trong trường hợp Diều hâu gặp Bồ câu, Bồ câu sẽ lập tức rút lui và Diều hâu sẽ chiếm được nguồn lợi để tồn tại. Trường hợp cuối cùng, khi hai Bồ câu gặp nhau, chúng sẽ chia sẻ nguồn lợi và cùng chung sống. Ta có thể tóm tắt lại thành mô hình sau:


Diều hâu
Bồ câu
Diều hâu
(1/2)*(V-C)
V
Bồ câu
0
V/2

Có thể nói rằng, nếu tất cả cá thể trong quần thể đều chỉ đi theo một chiến lược mà không có bất kỳ đột biến nào xảy ra thì khi điều kiện sống thay đổi, khả năng quần thể bị tuyệt diệt là rất lớn. Giả sử, ΔF(s1, s2) là độ thích ứng của quần thể khi áp dụng chiến lược s1 chống lại quần thể đối địch với chiến lược s2, và đặt F(s) là tổng độ thích ứng của quần thể khi áp dụng chiến lược s, F0 là cấu trúc quần thể ban đầu. Nếu σ là chiến lược tiến hóa bền vững và µ là chiến lược gây hấn thì ta có:

F(σ) = F0+ (1 – p) ΔF(σ, σ) + p ΔF(σ, µ)
F(µ) = F0+ (1 – p) ΔF(µ, σ) + p ΔF(µ, µ)

Với p là tỷ lệ quần thể khi áp dụng chiến lược µ
Do σ là chiến lược tiến hóa bền vững, khả năng  thích ứng của quần thể áp dụng chiến lược σ sẽ phải lớn hơn khả năng thích ứng của quần thể áp dụng chiến lược μ. Bây giờ, khi p tiệm cận đến 0, lúc đó ta có:

ΔF(σ,σ) > ΔF(μ,σ)
Hay                                                       
ΔF(σ,σ) = ΔF(μ,σ) và ΔF(σ,μ) > ΔF(μ,μ)

Nói khác, điều này có nghĩa là chiến lược σ là chiến lược tiến hóa bền vững khi thỏa mãn một trong hai điều kiện: (1) chiến lược σ tốt hơn bất kỳ chiến lược nào khác chống lại nó, hoặc (2) một số biến dị có thể tương đương với σ nhưng không thể làm tốt được như σ. Như vậy, trong trò chơi Diều hâu- Bồ câu, chiến lược Bồ câu không phải là một chiến lược tiến hóa bền vững do quần thể chỉ toàn Bồ câu có thể bị tiêu diệt bởi một quần thể Diều hâu. Nếu giá trị V lớn hơn C thì chiến lược Diều hâu là một chiến lược tiến hóa bền vững do trong trường hợp đó, nguồn lợi thu được có thể bù đắp toàn bộ tổn thất C khi cạnh tranh. Tuy nhiên nếu V nhỏ hơn C thì không có chiến lược tiến hóa bền vững nếu quần thể chỉ theo đơn thuần một chiến lược, cần phải có sự đan xen chiến lược để thu được một chiến lược tiến hóa tốt nhất.

Trong các nghiên cứu của Maynarn Smith và Price, khái niệm về các giải pháp đan xen được phát triển, trong đó, hai ý tưởng quan trọng nhất là “tập hợp tiến hóa bền vững” (evolutionarily stable set) và “giới hạn chiến lược tiến hóa bền vững” (limit ESS). Các công trình của họ đã đưa ra một sự tổng hợp các khái niệm về chiến lược tiến hóa bền vững và sau đó mở rộng khái niệm chiến lược tiến hóa bền vững thành các trò chơi đối kháng.

2.2.  Động học của quần thể

Một ví dụ điển hình cho lối tiếp cận thứ hai là trò chơi Thế lưỡng nan của người tù. Trong trò chơi này, các cá thể có hai chiến lược để lựa chọn, là “Hợp tác” và “Đào ngũ”. Dưới đây là ma trận các trường hợp xảy ra của trò chơi này:


Hợp tác
Đào ngũ
Hợp tác
(R, R’)
(S,T’)
Đào ngũ
(T, S’)
(P, P’)

Trong đó, T > R > P > S và T’ > R’ > P’ > S’.

Đầu tiên, hãy giả sử rằng quần thể này đủ lớn, trong trường hợp này, chúng ta có thể biểu diễn sự bền vững của quần thể bằng các tỷ lệ hợp tác pc và tỷ lệ đào ngũ pd. Khi đó, độ tương thích trung bình của cả quần thể khi hợp tác là Wc và khi đào ngũ là Wd, W là độ tương thích trung bình của cả quần thể.

Wc= F0 + pcΔF(C,C) + pdΔF(C,D)
Wd= F0 + pcΔF(D,C) + pdΔF(D,D)
W = pcWc + pdWd

Thứ hai, nếu giả thiết rằng tỷ lệ quần thể theo chiến lược hợp tác và đào ngũ trong lần chơi kế tiếp có liên quan đến tỷ lệ hợp tác và đào ngũ ở lần chơi này thì ta có:



Độ thích ứng của quần thể là:

c= F0 +  pcΔF(C,C) + pdΔF(C,D)
      = F0 +  pcR  + pdS
Wd= F0 +  pcΔF(D,C) + pd ΔF(D,D)
      = F0 + pcT + pdP

Do T > R và P > S nên Wd > Wc và Wd > W > Wc. Điều này có nghĩa là:





Do đó, tỷ lệ chọn chiến lược ở các thế hệ tiếp sau sẽ là:





Theo thời gian, quần thể lựa chọn chiến lược hợp tác có thể sẽ bị tuyệt chủng.

Các mô hình trên đây chứng minh rằng, mặc dù có thể tồn tại một số lượng rất lớn các trường hợp có thể xảy ra nhưng cả hai cách tiếp cận đều hướng đến một kết luận chung là chiến lược tiến hóa tốt sẽ giúp các loài không bị tuyệt chủng.

Biên dịch: Phạm Ngọc Sơn
Nguồn:


Stanford Encyclopedia of Philosophy: http://plato.stanford.edu/index.html

Điểm 4.3/5 dựa vào 43 đánh giá
  • Lazada : Mở chương trình "giá khuynh đảo", giới hạn mỗi người mua tối đa 2 sản phẩm Click xem
  • Adayroi : iPhone 7 lần đầu về giá dưới 15 triệu đồng Click xem
  • Tiki : Giảm 10% cho thẻ tín dụng HSBC Click xem

Bài liên quan


EmoticonEmoticon

:)
:(
hihi
:-)
:D
=D
:-d
;(
;-(
@-)
:o
:>)
(o)
:p
:-?
(p)
:-s
8-)
:-t
:-b
b-(
(y)
x-)
(h)