FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2452, 529 aa 1>>>pF1KE2452 529 - 529 aa - 529 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.3901+/-0.000719; mu= 14.2345+/- 0.044 mean_var=92.0486+/-18.378, 0's: 0 Z-trim(112.0): 78 B-trim: 0 in 0/52 Lambda= 0.133680 statistics sampled from 12774 (12854) to 12774 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.737), E-opt: 0.2 (0.395), width: 16 Scan time: 2.280 The best scores are: opt bits E(32554) CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 3658 715.3 4.4e-206 CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 2986 585.7 4.4e-167 CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1919 379.9 4.6e-105 CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1841 364.8 1.3e-100 CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1639 325.9 6.7e-89 CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1522 303.3 4.2e-82 CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1423 284.2 2.2e-76 CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 1397 279.2 7.3e-75 CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1318 264.0 2.9e-70 CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 1314 263.2 5.1e-70 CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 1285 257.6 2.6e-68 CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1281 256.8 3.9e-68 CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 1281 256.8 4.2e-68 CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 1232 247.4 2.9e-65 CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 1113 224.4 2.3e-58 CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 989 200.5 3.4e-51 CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 971 197.0 4e-50 CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 903 183.9 3.1e-46 CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 715 147.7 2.9e-35 CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 710 146.7 5.5e-35 CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 682 141.2 1.7e-33 CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 649 134.9 2.1e-31 CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 628 130.9 3.5e-30 CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 619 129.2 1.2e-29 CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 588 123.2 7.2e-28 CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 572 120.1 6.2e-27 CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 567 119.1 1.1e-26 CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 567 119.1 1.1e-26 CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 566 118.9 1.2e-26 CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 539 113.7 4.5e-25 CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 536 113.2 7.4e-25 CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 480 102.1 5e-22 CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 486 103.5 5.3e-22 CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 486 103.5 5.5e-22 CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 406 88.1 2.5e-17 CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 333 73.8 2.3e-13 CCDS4358.1 GABRG2 gene_id:2566|Hs108|chr5 ( 467) 335 74.4 3.3e-13 CCDS4359.1 GABRG2 gene_id:2566|Hs108|chr5 ( 475) 335 74.4 3.3e-13 CCDS3470.1 GABRG1 gene_id:2565|Hs108|chr4 ( 465) 317 70.9 3.6e-12 CCDS4375.1 GABRP gene_id:2568|Hs108|chr5 ( 440) 313 70.1 5.9e-12 CCDS3474.1 GABRB1 gene_id:2560|Hs108|chr4 ( 474) 309 69.4 1.1e-11 CCDS10018.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 297 67.0 5.3e-11 CCDS4354.1 GABRB2 gene_id:2561|Hs108|chr5 ( 474) 296 66.9 6.1e-11 CCDS4355.1 GABRB2 gene_id:2561|Hs108|chr5 ( 512) 296 66.9 6.5e-11 CCDS3796.1 GLRB gene_id:2743|Hs108|chr4 ( 497) 295 66.7 7.3e-11 CCDS10019.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 293 66.3 9.1e-11 >>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa) initn: 3658 init1: 3658 opt: 3658 Z-score: 3813.4 bits: 715.3 E(32554): 4.4e-206 Smith-Waterman score: 3658; 100.0% identity (100.0% similar) in 529 aa overlap (1-529:1-529) 10 20 30 40 50 60 pF1KE2 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETED 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 RLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 RWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 RWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 SSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 SSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 NSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 NSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 ISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 ISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 TMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 TMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 DRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 DRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHL 430 440 450 460 470 480 490 500 510 520 pF1KE2 RSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 RSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 490 500 510 520 >>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa) initn: 2983 init1: 2983 opt: 2986 Z-score: 3113.1 bits: 585.7 E(32554): 4.4e-167 Smith-Waterman score: 3530; 97.2% identity (97.2% similar) in 529 aa overlap (1-529:1-514) 10 20 30 40 50 60 pF1KE2 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETED 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKL ::::::::::::::::::::::: :::::::::::::::::::::: CCDS64 RLFKHLFRGYNRWARPVPNTSDV---------------DEKNQMMTTNVWLKQEWSDYKL 70 80 90 100 130 140 150 160 170 180 pF1KE2 RWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 RWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYK 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE2 SSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 SSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTY 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE2 NSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 NSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLC 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE2 ISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 ISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTH 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE2 TMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 TMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEE 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE2 DRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 DRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHL 410 420 430 440 450 460 490 500 510 520 pF1KE2 RSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 RSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 470 480 490 500 510 >>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa) initn: 2271 init1: 1898 opt: 1919 Z-score: 1999.7 bits: 379.9 E(32554): 4.6e-105 Smith-Waterman score: 1919; 75.1% identity (86.3% similar) in 386 aa overlap (25-406:4-380) 10 20 30 40 50 pF1KE2 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTET-- :: : : : :: :.: ...::.:: CCDS13 MELGGPGAPRLLP-----PLLLLLGTGLLRASSHVETRA 10 20 30 60 70 80 90 100 110 pF1KE2 --EDRLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWS :.::.:.:: :::.:.::: : ::::.:::::::::::::::::::::::::.:::: CCDS13 HAEERLLKKLFSGYNKWSRPVANISDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWH 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE2 DYKLRWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPP ::::::.:.:. :.::.:.:::.:: :::::::::::.:::::.:::::: : :.:.:: CCDS13 DYKLRWDPADYENVTSIRIPSELIWRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPP 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE2 AIYKSSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNA ::::::::::::::::::::: ::::::::::::::: .:.. :: :.::::::.::.: CCDS13 AIYKSSCSIDVTFFPFDQQNCTMKFGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDA 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE2 TGTYNSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEK .::::..::.::::::::.::::::::::::::::::::::::::::::::::::.:::: CCDS13 VGTYNTRKYECCAEIYPDITYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEK 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE2 ITLCISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ITLCISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRS 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE2 PSTHTMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVV : ::::: ::: ..: ::: :::.:: . :. .: :.: . : CCDS13 PRTHTMPTWVRRVFLDIVPRLLLMKRPSVVKDNCR----RLIESMHKMASAPRFWPEPEG 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE2 VEEEDRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYI CCDS13 EPPATSGTQSLHPPSPSFCVPLDVPAEPGPSCKSPSDQLPPQQPLEAEKASPHPSPGPCR 400 410 420 430 440 450 >-- initn: 480 init1: 387 opt: 387 Z-score: 402.9 bits: 84.5 E(32554): 4e-16 Smith-Waterman score: 387; 78.6% identity (94.3% similar) in 70 aa overlap (460-529:558-627) 430 440 450 460 470 480 pF1KE2 APSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSV : ::: . .:.:::.::::::..::.: :: CCDS13 PCKCTCKKEPSSVSPSATVKTRSTKAPPPHLPLSPALTRAVEGVQYIADHLKAEDTDFSV 530 540 550 560 570 580 490 500 510 520 pF1KE2 KEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI :::::::::::::::::.:::::.:::.::::::.::::: CCDS13 KEDWKYVAMVIDRIFLWMFIIVCLLGTVGLFLPPWLAGMI 590 600 610 620 >>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa) initn: 1864 init1: 1602 opt: 1841 Z-score: 1919.8 bits: 364.8 E(32554): 1.3e-100 Smith-Waterman score: 1842; 56.7% identity (76.1% similar) in 506 aa overlap (33-526:14-501) 10 20 30 40 50 60 pF1KE2 PSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRL ::: : : :.: .:.: :: CCDS10 MGSGPLSLPLALSPPRLLLLLLLSLLPVA-----RASEAEHRL 10 20 30 70 80 90 100 110 120 pF1KE2 FKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRW :..::. ::. ::: :.:: ::..: .:..::. ::: ::.: ::.:::: :.::::.: CCDS10 FERLFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKW 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE2 NPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSS ::.:.:. .:::.. :: ::::::::: :.: : ::: : :: : :.::::.::: CCDS10 NPSDYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSS 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE2 CSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNS :.::::.:::: ::: ::::::.:::::::: . ....::::::::::::..: : .. CCDS10 CKIDVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHD 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE2 KKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCIS ::.:: :::::.::.. :::::::::::::::::::: :::::::::::::::.::::: CCDS10 IKYNCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCIS 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE2 VLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTM ::::::::::.::: ::::::::::::::::::::::::::::::::::::.:.:.:::: CCDS10 VLLSLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTM 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE2 PHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDR : ::. ..:. .:: ..:.:: . : : : ::.. : :.. CCDS10 PSWVKTVFLNLLPRVMFMTRPTSNEGNAQKPR----PLYGAELSNLNCFSRA-----ESK 340 350 360 370 380 430 440 450 460 470 pF1KE2 WACAGHVAPSVGTLCSHGH------------LHSGASGPKAEALLQEGELLLSPHMQKAL :. : .:.. : : ..:. ...:.:. . : ::....:. CCDS10 GCKEGY--PCQDGMCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSAL--SPEIKEAI 390 400 410 420 430 440 480 490 500 510 520 pF1KE2 EGVHYIADHLRSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI ..:.:::....... . ...:::::::::::::::.: .::.::: :::: :..: CCDS10 QSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIFLWVFTLVCILGTAGLFLQPLMAREDA 450 460 470 480 490 500 >>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa) initn: 1659 init1: 1602 opt: 1639 Z-score: 1709.5 bits: 325.9 E(32554): 6.7e-89 Smith-Waterman score: 1640; 55.7% identity (74.7% similar) in 474 aa overlap (33-494:14-466) 10 20 30 40 50 60 pF1KE2 PSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRL ::: : : :.: .:.: :: CCDS53 MGSGPLSLPLALSPPRLLLLLLLSLLPVA-----RASEAEHRL 10 20 30 70 80 90 100 110 120 pF1KE2 FKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRW :..::. ::. ::: :.:: ::..: .:..::. ::: ::.: ::.:::: :.::::.: CCDS53 FERLFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKW 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE2 NPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSS ::.:.:. .:::.. :: ::::::::: :.: : ::: : :: : :.::::.::: CCDS53 NPSDYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSS 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE2 CSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNS :.::::.:::: ::: ::::::.:::::::: . ....::::::::::::..: : .. CCDS53 CKIDVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHD 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE2 KKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCIS ::.:: :::::.::.. :::::::::::::::::::: :::::::::::::::.::::: CCDS53 IKYNCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCIS 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE2 VLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTM ::::::::::.::: ::::::::::::::::::::::::::::::::::::.:.:.:::: CCDS53 VLLSLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTM 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE2 PHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDR : ::. ..:. .:: ..:.:: . : : : ::.. : :.. CCDS53 PSWVKTVFLNLLPRVMFMTRPTSNEGNAQKPR----PLYGAELSNLNCFSRA-----ESK 340 350 360 370 380 430 440 450 460 470 pF1KE2 WACAGHVAPSVGTLCSHGH------------LHSGASGPKAEALLQEGELLLSPHMQKAL :. : .:.. : : ..:. ...:.:. . :::....:. CCDS53 GCKEGY--PCQDGMCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSA--LSPEIKEAI 390 400 410 420 430 440 480 490 500 510 520 pF1KE2 EGVHYIADHLRSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI ..:.:::.... :.. .::. : CCDS53 QSVKYIAENMK---AQNEAKEEQKAQEIQQLKRKEKSTETSDQEPGL 450 460 470 480 >>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa) initn: 1766 init1: 1520 opt: 1522 Z-score: 1587.5 bits: 303.3 E(32554): 4.2e-82 Smith-Waterman score: 1733; 53.9% identity (76.0% similar) in 484 aa overlap (47-525:22-488) 20 30 40 50 60 70 pF1KE2 WWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARP : . .: ::.:::..:: ::.. :: CCDS61 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRP 10 20 30 40 50 80 90 100 110 120 130 pF1KE2 VPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVP : :.:: : :.: ..:.:: .::: ::.: ::.::.. :.::::::.: .. .: .:::: CCDS61 VENVSDPVTVHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVP 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE2 SEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQN .. :: ::::::::: :.: : ::: : .: . :.::::.:::: .:.::::::.:: CCDS61 ADKIWKPDIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQN 120 130 140 150 160 170 200 210 220 230 240 250 pF1KE2 CKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVT :..::::::::::.::: . . ::..:.::..:: :..:.: .. ::.:: ::: :.: CCDS61 CSLKFGSWTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDIT 180 190 200 210 220 230 260 270 280 290 300 310 pF1KE2 YAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITE :.: :::::.:::::::::::.:: :::::::::::::::.:::::::::::::::.::: CCDS61 YSFYIRRLPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITE 240 250 260 270 280 290 320 330 340 350 360 370 pF1KE2 IIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPR :::::::.::.::::::::::::::::.::::::.:.:.:.:::::.::. ..: .:. CCDS61 TIPSTSLVVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQ 300 310 320 330 340 350 380 390 400 410 420 430 pF1KE2 WLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTL ::: : :. . .. :: : .. .. . :.: : CCDS61 VLLMRWP-------------LDKTRG---TGSDAVPRGLA-RRPAKGKLASHGEPRHLKE 360 370 380 390 440 450 460 470 480 490 pF1KE2 CSHGHLHSGASGPKAEALLQEGELLL-----SPHMQKALEGVHYIADHLRSEDADSSVKE : : : . . : . : . .. ::... ....:..::....:.. . :.. CCDS61 CFHCHKSNELATSKRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVED 400 410 420 430 440 450 500 510 520 pF1KE2 DWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI ::::::::.::.:::.::::: .:: :::: :.: CCDS61 DWKYVAMVVDRVFLWVFIIVCVFGTAGLFLQPLLGNTGKS 460 470 480 490 >>CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 (458 aa) initn: 1579 init1: 860 opt: 1423 Z-score: 1484.8 bits: 284.2 E(32554): 2.2e-76 Smith-Waterman score: 1567; 52.4% identity (73.9% similar) in 479 aa overlap (46-522:15-448) 20 30 40 50 60 70 pF1KE2 LWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQG-GSHTETEDRLFKHLFRGYNRWA :.. : .: .:.:: :..:::.::..:. CCDS61 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWV 10 20 30 40 80 90 100 110 120 130 pF1KE2 RPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLR ::: ...:.. : :::.:.::.:::::::.:::::::::::.:.:::::: :.:.: :.. CCDS61 RPVLHSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIK 50 60 70 80 90 100 140 150 160 170 180 190 pF1KE2 VPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQ :::: .:.:::::..::::.: . :::. . :.::: :.::: :::::..::::::::. CCDS61 VPSESLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDR 110 120 130 140 150 160 200 210 220 230 240 250 pF1KE2 QNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPD :::.::::::::: . .:: ....:: ::....::: :.:: : .... . :: CCDS61 QNCSMKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPF 170 180 190 200 210 220 260 270 280 290 300 310 pF1KE2 VTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLI .::.::.::::::::. :::::: .: ::::::::::: :::..: :::.:::::::.: CCDS61 ITYSFVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVI 230 240 250 260 270 280 320 330 340 350 360 370 pF1KE2 TEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPST-HTMPHWVRGALLGC :::::.: ::::::::::: ::::::::..::::.:::::: :: : : ::. .: CCDS61 EEIIPSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQK 290 300 310 320 330 340 380 390 400 410 420 430 pF1KE2 VPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSV .:. : :. : : . :: . :: . ::. :.: . CCDS61 LPKLLCMKD--------HVDRYS-SP---------EKEESQPVVK--------GKVLEK- 350 360 370 440 450 460 470 480 490 pF1KE2 GTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDW : . :..:: .: ..:: ....::. :...: :.: .:: CCDS61 ----------------KKQKQLSDGEKVLVAFLEKAADSIRYISRHVKKEHFISQVVQDW 380 390 400 410 500 510 520 pF1KE2 KYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI :.::.:.::::::::.:: :.. .: : CCDS61 KFVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH 420 430 440 450 >>CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 (468 aa) initn: 1554 init1: 540 opt: 1397 Z-score: 1457.5 bits: 279.2 E(32554): 7.3e-75 Smith-Waterman score: 1500; 51.2% identity (71.2% similar) in 475 aa overlap (49-522:37-449) 20 30 40 50 60 70 pF1KE2 LLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARPVP : . .: .. :: :.: ::. :.::.::: CCDS10 GPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVE 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE2 NTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSE . .: . ..:::.:.::.:::::::.::::::::::: : :::::: :.:.: .::::. CCDS10 HLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSD 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE2 MIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCK .: :::::..::::.: : ::. . .::: :.::: :::::.::::::::: :::. CCDS10 SVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCS 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE2 MKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYA ::::::::: ...:. .: :: .:....::: ::.:::. ... .:: :: :::. CCDS10 MKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYS 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE2 FVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEII :::.:::::::. :::::. .: ::::::::::. :::: :: :::.:::::::.: ::: CCDS10 FVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEII 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE2 PSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHT-MPHWVRGALLGCVPRW ::.: :::::::::.::::::::::..:::..:.:::: :::. : :: .: .:. CCDS10 PSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKL 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE2 LLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLC :: ..:.:: : . .:: . CCDS10 -----------LC-------------MRSHVD---RYFTQKEETE--------------- 370 380 440 450 460 470 480 490 pF1KE2 SHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVA :: ::::. .. ::....::. :. .:. : ::::..: CCDS10 ------SG-SGPKSS----------RNTLEAALDSIRYITRHIMKENDVREVVEDWKFIA 390 400 410 420 500 510 520 pF1KE2 MVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI .:.::.::: :..: ..:..:::.: CCDS10 QVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK 430 440 450 460 >>CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 (479 aa) initn: 1686 init1: 1318 opt: 1318 Z-score: 1375.0 bits: 264.0 E(32554): 2.9e-70 Smith-Waterman score: 1623; 52.1% identity (73.3% similar) in 484 aa overlap (47-525:22-473) 20 30 40 50 60 70 pF1KE2 WWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARP : . .: ::.:::..:: ::.. :: CCDS56 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRP 10 20 30 40 50 80 90 100 110 120 130 pF1KE2 VPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVP : :.:: : :.: ..:.:: .: :.::::::.: .. .: .:::: CCDS56 VENVSDPVTVHFEVAITQLANVI---------------WNDYKLRWDPMEYDGIETLRVP 60 70 80 90 140 150 160 170 180 190 pF1KE2 SEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQN .. :: ::::::::: :.: : ::: : .: . :.::::.:::: .:.::::::.:: CCDS56 ADKIWKPDIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQN 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE2 CKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVT :..::::::::::.::: . . ::..:.::..:: :..:.: .. ::.:: ::: :.: CCDS56 CSLKFGSWTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDIT 160 170 180 190 200 210 260 270 280 290 300 310 pF1KE2 YAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITE :.: :::::.:::::::::::.:: :::::::::::::::.:::::::::::::::.::: CCDS56 YSFYIRRLPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITE 220 230 240 250 260 270 320 330 340 350 360 370 pF1KE2 IIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPR :::::::.::.::::::::::::::::.::::::.:.:.:.:::::.::. ..: .:. CCDS56 TIPSTSLVVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQ 280 290 300 310 320 330 380 390 400 410 420 430 pF1KE2 WLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTL ::: : :. . .. :: : .. .. . :.: : CCDS56 VLLMRWP-------------LDKTRG---TGSDAVPRGLA-RRPAKGKLASHGEPRHLKE 340 350 360 370 440 450 460 470 480 490 pF1KE2 CSHGHLHSGASGPKAEALLQEGELLL-----SPHMQKALEGVHYIADHLRSEDADSSVKE : : : . . : . : . .. ::... ....:..::....:.. . :.. CCDS56 CFHCHKSNELATSKRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVED 380 390 400 410 420 430 500 510 520 pF1KE2 DWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI ::::::::.::.:::.::::: .:: :::: :.: CCDS56 DWKYVAMVVDRVFLWVFIIVCVFGTAGLFLQPLLGNTGKS 440 450 460 470 >>CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 (502 aa) initn: 1587 init1: 679 opt: 1314 Z-score: 1370.6 bits: 263.2 E(32554): 5.1e-70 Smith-Waterman score: 1584; 51.7% identity (73.9% similar) in 472 aa overlap (56-525:26-483) 30 40 50 60 70 80 pF1KE2 GEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRG--YNRWARPVPNTSDV :.::.:: .::. ::. ::. : :.. CCDS10 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSEL 10 20 30 40 50 90 100 110 120 130 140 pF1KE2 VIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSEMIWIP : :.. .:.::::.: :..:.::::::: ::: ::.: :.: .: :. ..:.::. ::.: CCDS10 VTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLP 60 70 80 90 100 110 150 160 170 180 190 200 pF1KE2 DIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCKMKFGS :.:::::::: . :. ...: . :.. :.:::::::.:.:.: :::::::: ::: : CCDS10 DVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRS 120 130 140 150 160 170 210 220 230 240 250 260 pF1KE2 WTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYAFVIRR ::::...::: ....: :. :::: :: : : . : : :.:: :.::: CCDS10 WTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDST---YVDITYDFIIRR 180 190 200 210 220 230 270 280 290 300 310 320 pF1KE2 LPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEIIPSTSL ::::::::::::.::. :..::::::::::::.::::::::.::::::::..:.: ::: CCDS10 KPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSL 240 250 260 270 280 290 330 340 350 360 370 380 pF1KE2 VIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPRWLLMNRP .::.:.::.:::..::.::: .: :::::::::.:::: ::. ..: .: :.:..: CCDS10 DVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQP 300 310 320 330 340 350 390 400 410 420 430 440 pF1KE2 PPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLCSHGHLH . : ::.: . :. ::. : .: . : : . : CCDS10 R---HHCARQRLRLRRRQREREGAGALFFREA--PGADSCTCFVNRASVQGLAGAFGAEP 360 370 380 390 400 450 460 470 480 490 500 pF1KE2 SGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVAMVIDRI . ..:: . :: . ...:..::..::::.:::: :.::.::::::::::::. CCDS10 APVAGPG-----RSGEPC-GCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRL 410 420 430 440 450 460 510 520 pF1KE2 FLWLFIIVCFLGTIGLFLPPFLAGMI :::.:..:: .::::.:: :.. CCDS10 FLWIFVFVCVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK 470 480 490 500 529 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 04:15:17 2016 done: Sat Nov 5 04:15:17 2016 Total Scan time: 2.280 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]