LUẬN VĂN: SẮP HÀNG ĐA CHUỖI
Số trang: 38
Loại file: pdf
Dung lượng: 769.77 KB
Lượt xem: 28
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mỗi một thuật toán, một chương trình sắp hàng đa chuỗi đều có những ưu điểm và nhược điểm riêng của mình. Vì thế cần tìm cách tối ưu từng ưu điểm của từng phương pháp, và hạn chế nhược điểm của chúng.Khóa luận sẽ trình bày về các phương pháp sắp hàng đa chuỗi được ứng dụng rộng rãi hiện nay đồng thời phân tích và đưa ra một giải pháp nhằm phát huy tối đa ưu điểm cũng như hạn chế tối thiểu nhược điểm của từng phương pháp....
Nội dung trích xuất từ tài liệu:
LUẬN VĂN:SẮP HÀNG ĐA CHUỖI TRƯỜNG …………………. KHOA………………………. ----- ----- Báo cáo tốt nghiệpĐề tài: SẮP HÀNG ĐA CHUỖI Lời cảm ơn Tôi xin bày tỏ lòng biết ơn sâu sắc nhất tới Tiến sỹ Lê Sỹ Vinh. Thầy làngười trực tiếp giao đề tài và tận tình hướng dẫn cũng như giúp đỡ tôi trong quátrình thực hiện luận văn này. Đồng thời tôi xin chân thành cảm ơn thầy Từ Minh Phương, hiện đangcông tác tại SUlab công ty FPT. Thầy đã tạo điều kiện và đưa ra những lờikhuyên bổ ích cho tôi trong thời gian cuối thực hiện khóa luận. Hà Nội tháng 05 năm 2010 Sinh viên Nguyễn Hà Anh Tuấn Tóm tắt nội dung Sắp hàng đa chuỗi là một bài toán tin sinh học phổ biến trên thế giới hiện nay,mặc dù đã có rất nhiều phương pháp tiếp cận cũng như thuật toán được đưa ra để giảiquyết bài toán này tuy nhiên chưa thuật toán nào cho kết quả tới khả năng tối ưu.Trong nội dung của khóa luận, tôi xin được khái quát tổng quan bài toán sắp hàng đachuỗi cũng như một số thuật toán tiêu biểu trên thế giới hiện nay. Đồng thời tôi cũngxin đưa ra một số ý kiến của mình cũng như giải pháp nhằm tăng tính ổn định và tincậy của các thuật toán này.Mục lục Chương 1: Giới thiệu chung..............................................................................................1 Chương 2: Các phương pháp phổ biến hiện nay...............................................................6 1.MUSCLE ...................................................................................................................6 2.MAFFT ......................................................................................................................8 3. ProbCons .................................................................................................................10 Chương 3: EM-Coffee (Extended M-Coffee).................................................................12 1.Đặt trọng số khi kết hợp các thuật toán....................................................................12 2.MUMSA...................................................................................................................13 3.T-Coffee, M-Coffee .................................................................................................14 3.1. T-Coffee ...........................................................................................................14 3.2. M-Coffee ..........................................................................................................20 4.EM-Coffee ...............................................................................................................21 Chương 4: Kết quả thực nghiệm .....................................................................................23 1. Bộ dữ liệu BAliBASE.............................................................................................23 Chương 5: Kết luận .........................................................................................................31 Tài liệu tham khảo...........................................................................................................32 Chương 1: Giới thiệu chung Phần giới thiệu về sắp hàng đa chuỗi( multiple sequence alignment) dưới đâyđược viết một phần dựa trên luận văn tiến sĩ của thầy Lê Sỹ Vinh[31] và quyển sáchInferring Phylogenies của giáo sư Joseph Felsenstein[30]. Theo học thuyết tiến hóa của Darwin[1], tất cả các sinh vật trên trái đất đều cócùng một tổ tiên chung. Theo thời gian và quá trình tiến hóa của các sinh vật, cácADN của chúng dần đổi khác biệt với tổ tiên. Các ADN biến đổi từ cùng một nguồngốc được gọi chung là các ADN tương đồng(homology). Và tổng quát hơn nữa, mộtchuỗi ADN tiến hóa từ cùng một tổ tiên là chuỗi tương đồng. Những sự biến đổi củacác chuỗi ADN có thể nhiều hay ít, có thể xảy ra đồng thời hay phân tán tuy nhiênchúng vẫn giữ lại một số thông tin có trong chuỗi ADN của tổ tiên. Theo nhận địnhcủa các nhà khoa học, việc biến đổi ADN của các sinh vật đều thông qua 3 phép biếnđổi sau: − Phép chèn, đưa thêm một ADN vào chuỗi. − Phép xóa, xóa đi 1 ADN trong chuỗi. − Phép thay thế, thay thế ADN này bằng một ADN khác.Trong khi các phép thay thế chỉ làm thay đổi những vị trí nhất định của một chuỗiADN chứ không làm thay đổi độ dài của chuỗi ADN đó, một phép chèn hay một phépxóa lại làm cho số lượng ADN của chuỗi nhiều hơn một ADN hoặc ít đi một ADN.Tuy nhiên, chúng ta không thể xác định được sự khác biệt giữa phép chèn và phép xóanên 2 phép này được gộp lại thành một phép biến đổi và gọi tên ch ...
Nội dung trích xuất từ tài liệu:
LUẬN VĂN:SẮP HÀNG ĐA CHUỖI TRƯỜNG …………………. KHOA………………………. ----- ----- Báo cáo tốt nghiệpĐề tài: SẮP HÀNG ĐA CHUỖI Lời cảm ơn Tôi xin bày tỏ lòng biết ơn sâu sắc nhất tới Tiến sỹ Lê Sỹ Vinh. Thầy làngười trực tiếp giao đề tài và tận tình hướng dẫn cũng như giúp đỡ tôi trong quátrình thực hiện luận văn này. Đồng thời tôi xin chân thành cảm ơn thầy Từ Minh Phương, hiện đangcông tác tại SUlab công ty FPT. Thầy đã tạo điều kiện và đưa ra những lờikhuyên bổ ích cho tôi trong thời gian cuối thực hiện khóa luận. Hà Nội tháng 05 năm 2010 Sinh viên Nguyễn Hà Anh Tuấn Tóm tắt nội dung Sắp hàng đa chuỗi là một bài toán tin sinh học phổ biến trên thế giới hiện nay,mặc dù đã có rất nhiều phương pháp tiếp cận cũng như thuật toán được đưa ra để giảiquyết bài toán này tuy nhiên chưa thuật toán nào cho kết quả tới khả năng tối ưu.Trong nội dung của khóa luận, tôi xin được khái quát tổng quan bài toán sắp hàng đachuỗi cũng như một số thuật toán tiêu biểu trên thế giới hiện nay. Đồng thời tôi cũngxin đưa ra một số ý kiến của mình cũng như giải pháp nhằm tăng tính ổn định và tincậy của các thuật toán này.Mục lục Chương 1: Giới thiệu chung..............................................................................................1 Chương 2: Các phương pháp phổ biến hiện nay...............................................................6 1.MUSCLE ...................................................................................................................6 2.MAFFT ......................................................................................................................8 3. ProbCons .................................................................................................................10 Chương 3: EM-Coffee (Extended M-Coffee).................................................................12 1.Đặt trọng số khi kết hợp các thuật toán....................................................................12 2.MUMSA...................................................................................................................13 3.T-Coffee, M-Coffee .................................................................................................14 3.1. T-Coffee ...........................................................................................................14 3.2. M-Coffee ..........................................................................................................20 4.EM-Coffee ...............................................................................................................21 Chương 4: Kết quả thực nghiệm .....................................................................................23 1. Bộ dữ liệu BAliBASE.............................................................................................23 Chương 5: Kết luận .........................................................................................................31 Tài liệu tham khảo...........................................................................................................32 Chương 1: Giới thiệu chung Phần giới thiệu về sắp hàng đa chuỗi( multiple sequence alignment) dưới đâyđược viết một phần dựa trên luận văn tiến sĩ của thầy Lê Sỹ Vinh[31] và quyển sáchInferring Phylogenies của giáo sư Joseph Felsenstein[30]. Theo học thuyết tiến hóa của Darwin[1], tất cả các sinh vật trên trái đất đều cócùng một tổ tiên chung. Theo thời gian và quá trình tiến hóa của các sinh vật, cácADN của chúng dần đổi khác biệt với tổ tiên. Các ADN biến đổi từ cùng một nguồngốc được gọi chung là các ADN tương đồng(homology). Và tổng quát hơn nữa, mộtchuỗi ADN tiến hóa từ cùng một tổ tiên là chuỗi tương đồng. Những sự biến đổi củacác chuỗi ADN có thể nhiều hay ít, có thể xảy ra đồng thời hay phân tán tuy nhiênchúng vẫn giữ lại một số thông tin có trong chuỗi ADN của tổ tiên. Theo nhận địnhcủa các nhà khoa học, việc biến đổi ADN của các sinh vật đều thông qua 3 phép biếnđổi sau: − Phép chèn, đưa thêm một ADN vào chuỗi. − Phép xóa, xóa đi 1 ADN trong chuỗi. − Phép thay thế, thay thế ADN này bằng một ADN khác.Trong khi các phép thay thế chỉ làm thay đổi những vị trí nhất định của một chuỗiADN chứ không làm thay đổi độ dài của chuỗi ADN đó, một phép chèn hay một phépxóa lại làm cho số lượng ADN của chuỗi nhiều hơn một ADN hoặc ít đi một ADN.Tuy nhiên, chúng ta không thể xác định được sự khác biệt giữa phép chèn và phép xóanên 2 phép này được gộp lại thành một phép biến đổi và gọi tên ch ...
Tìm kiếm theo từ khóa liên quan:
luận văn công nghệ thông tin tin sinh học sắp hàng đa chuỗi nhanh ngành tin học toán học ứng dụng thống kê khoa học máy tính trí tuệ nhân tạoTài liệu có liên quan:
-
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 509 1 0 -
Đề cương chi tiết học phần Trí tuệ nhân tạo
12 trang 478 0 0 -
52 trang 467 1 0
-
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 388 6 0 -
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 366 0 0 -
Thảo luận đề tài: Mối quan hệ giữa đầu tư theo chiều rộng và đầu tư theo chiều sâu
98 trang 341 0 0 -
96 trang 334 0 0
-
74 trang 329 0 0
-
Tài liệu dạy học môn Tin học trong chương trình đào tạo trình độ cao đẳng
348 trang 319 1 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng di động android quản lý khách hàng cắt tóc
81 trang 319 0 0