FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2034, 627 aa 1>>>pF1KE2034 627 - 627 aa - 627 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.7053+/-0.00107; mu= -3.8761+/- 0.064 mean_var=329.4524+/-66.761, 0's: 0 Z-trim(114.7): 84 B-trim: 151 in 1/52 Lambda= 0.070661 statistics sampled from 15193 (15277) to 15193 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.469), width: 16 Scan time: 3.030 The best scores are: opt bits E(32554) CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 4325 454.8 1.6e-127 CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 1919 209.4 9.7e-54 CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 1704 187.5 3.7e-47 CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1620 178.9 1.4e-44 CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1620 178.9 1.4e-44 CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1578 174.7 2.7e-43 CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 1406 157.1 4.9e-38 CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1399 156.4 7.9e-38 CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1373 153.7 5.1e-37 CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 1358 152.2 1.5e-36 CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1343 150.7 4.1e-36 CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 1284 144.7 2.8e-34 CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 1165 132.5 1.2e-30 CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 1118 127.8 3.5e-29 CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 1111 127.1 6.1e-29 CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 999 115.6 1.5e-25 CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 968 112.4 1.3e-24 CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 779 93.1 7.7e-19 CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 737 88.9 1.7e-17 CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 731 88.3 2.5e-17 CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 639 78.9 1.8e-14 CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 594 74.4 4.4e-13 CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 590 73.9 5.6e-13 CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 577 72.5 1e-12 CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 580 72.9 1.1e-12 CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 572 72.1 1.9e-12 CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 571 72.0 2e-12 CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 569 71.8 2.4e-12 CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 530 67.8 3.6e-11 CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 530 67.8 4e-11 >>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa) initn: 4325 init1: 4325 opt: 4325 Z-score: 2402.9 bits: 454.8 E(32554): 1.6e-127 Smith-Waterman score: 4325; 100.0% identity (100.0% similar) in 627 aa overlap (1-627:1-627) 10 20 30 40 50 60 pF1KE2 MELGGPGAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANISD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MELGGPGAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANISD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIWR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 PDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKFG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 SWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFVIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFVIR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 RLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPSTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPSTS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 LVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLLMKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLLMKR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 PSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAEPGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAEPGP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 SCKSPSDQLPPQQPLEAEKASPHPSPGPCRPPHGTQAPGLAKARSLSVQHMSSPGEAVEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SCKSPSDQLPPQQPLEAEKASPHPSPGPCRPPHGTQAPGLAKARSLSVQHMSSPGEAVEG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 GVRCRSRSIQYCVPRDDAAPEADGQAAGALASRNTHSAELPPPDQPSPCKCTCKKEPSSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GVRCRSRSIQYCVPRDDAAPEADGQAAGALASRNTHSAELPPPDQPSPCKCTCKKEPSSV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 SPSATVKTRSTKAPPPHLPLSPALTRAVEGVQYIADHLKAEDTDFSVKEDWKYVAMVIDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SPSATVKTRSTKAPPPHLPLSPALTRAVEGVQYIADHLKAEDTDFSVKEDWKYVAMVIDR 550 560 570 580 590 600 610 620 pF1KE2 IFLWMFIIVCLLGTVGLFLPPWLAGMI ::::::::::::::::::::::::::: CCDS13 IFLWMFIIVCLLGTVGLFLPPWLAGMI 610 620 >>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa) initn: 2271 init1: 1898 opt: 1919 Z-score: 1078.3 bits: 209.4 E(32554): 9.7e-54 Smith-Waterman score: 2102; 57.9% identity (68.9% similar) in 630 aa overlap (4-627:25-529) 10 20 30 pF1KE2 MELGGPGAPRLLP-----PLLLLLGTGLLRASSHVETRA :: : : : :: :.: ...::.:: CCDS60 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTET-- 10 20 30 40 50 40 50 60 70 80 90 pF1KE2 HAEERLLKKLFSGYNKWSRPVANISDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWH :.::.:.:: :::.:.::: : ::::.:::::::::::::::::::::::::.:::: CCDS60 --EDRLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWS 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE2 DYKLRWDPADYENVTSIRIPSELIWRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPP ::::::.:.:. :.::.:.:::.:: :::::::::::.:::::.:::::: : :.:.:: CCDS60 DYKLRWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPP 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 AIYKSSCSIDVTFFPFDQQNCTMKFGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDA ::::::::::::::::::::: ::::::::::::::: .:.. :: :.::::::.::.: CCDS60 AIYKSSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNA 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 VGTYNTRKYECCAEIYPDITYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEK .::::..::.::::::::.::::::::::::::::::::::::::::::::::::.:::: CCDS60 TGTYNSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEK 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 ITLCISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 ITLCISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRS 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 PRTHTMPTWVRRVFLDIVPRLLLMKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPA : ::::: ::: ..: ::: :::.:: CCDS60 PSTHTMPHWVRGALLGCVPRWLLMNRP--------------------------------- 360 370 380 400 410 420 430 440 450 pF1KE2 TSGTQSLHPPSPSFCVPLDVPAEPGPSCKSPSDQLPPQQPLEAEKASPHPSPGPCRPPHG :: .: :: . : :: CCDS60 --------PPPVELCHPLRL------------------------KLSP------------ 390 460 470 480 490 500 510 pF1KE2 TQAPGLAKARSLSVQHMSSPGEAVEGGVRCRSRSIQYCVPRDDAAPEADGQAAGALASR- : . . : .: : : . .. :. . .:: ..:.: :. CCDS60 ------------SYHWLESNVDAEEREVVVEEEDRWACAGH--VAP-----SVGTLCSHG 400 410 420 430 440 520 530 540 550 560 570 pF1KE2 NTHSAELPPPDQPSPCKCTCKKEPSSVSPSATVKTRSTKAPPPHLPLSPALTRAVEGVQY . ::. : : : : .. .: ::: . .:.:::.: CCDS60 HLHSGASGP-----------KAE-------ALLQE-------GELLLSPHMQKALEGVHY 450 460 470 580 590 600 610 620 pF1KE2 IADHLKAEDTDFSVKEDWKYVAMVIDRIFLWMFIIVCLLGTVGLFLPPWLAGMI :::::..::.: :::::::::::::::::::.:::::.:::.::::::.::::: CCDS60 IADHLRSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 480 490 500 510 520 >>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa) initn: 2071 init1: 1698 opt: 1704 Z-score: 960.0 bits: 187.5 E(32554): 3.7e-47 Smith-Waterman score: 1977; 55.7% identity (66.5% similar) in 630 aa overlap (4-627:25-514) 10 20 30 pF1KE2 MELGGPGAPRLLP-----PLLLLLGTGLLRASSHVETRA :: : : : :: :.: ...::.:: CCDS64 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTET-- 10 20 30 40 50 40 50 60 70 80 90 pF1KE2 HAEERLLKKLFSGYNKWSRPVANISDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWH :.::.:.:: :::.:.::: : ::: ::::::::::::.:::: CCDS64 --EDRLFKHLFRGYNRWARPVPNTSDV---------------DEKNQMMTTNVWLKQEWS 60 70 80 90 100 100 110 120 130 140 150 pF1KE2 DYKLRWDPADYENVTSIRIPSELIWRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPP ::::::.:.:. :.::.:.:::.:: :::::::::::.:::::.:::::: : :.:.:: CCDS64 DYKLRWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPP 110 120 130 140 150 160 160 170 180 190 200 210 pF1KE2 AIYKSSCSIDVTFFPFDQQNCTMKFGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDA ::::::::::::::::::::: ::::::::::::::: .:.. :: :.::::::.::.: CCDS64 AIYKSSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNA 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE2 VGTYNTRKYECCAEIYPDITYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEK .::::..::.::::::::.::::::::::::::::::::::::::::::::::::.:::: CCDS64 TGTYNSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEK 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE2 ITLCISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 ITLCISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRS 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 PRTHTMPTWVRRVFLDIVPRLLLMKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPA : ::::: ::: ..: ::: :::.:: CCDS64 PSTHTMPHWVRGALLGCVPRWLLMNRP--------------------------------- 350 360 400 410 420 430 440 450 pF1KE2 TSGTQSLHPPSPSFCVPLDVPAEPGPSCKSPSDQLPPQQPLEAEKASPHPSPGPCRPPHG :: .: :: . : :: CCDS64 --------PPPVELCHPLRL------------------------KLSP------------ 370 380 460 470 480 490 500 510 pF1KE2 TQAPGLAKARSLSVQHMSSPGEAVEGGVRCRSRSIQYCVPRDDAAPEADGQAAGALASR- : . . : .: : : . .. :. . .:: ..:.: :. CCDS64 ------------SYHWLESNVDAEEREVVVEEEDRWACAGH--VAP-----SVGTLCSHG 390 400 410 420 520 530 540 550 560 570 pF1KE2 NTHSAELPPPDQPSPCKCTCKKEPSSVSPSATVKTRSTKAPPPHLPLSPALTRAVEGVQY . ::. : : : : .. .: ::: . .:.:::.: CCDS64 HLHSGASGP-----------KAE-------ALLQE-------GELLLSPHMQKALEGVHY 430 440 450 460 580 590 600 610 620 pF1KE2 IADHLKAEDTDFSVKEDWKYVAMVIDRIFLWMFIIVCLLGTVGLFLPPWLAGMI :::::..::.: :::::::::::::::::::.:::::.:::.::::::.::::: CCDS64 IADHLRSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 470 480 490 500 510 >>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa) initn: 1708 init1: 1592 opt: 1620 Z-score: 914.0 bits: 178.9 E(32554): 1.4e-44 Smith-Waterman score: 1620; 66.1% identity (83.6% similar) in 360 aa overlap (11-370:12-368) 10 20 30 40 50 pF1KE2 MELGGPGAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANIS : :: :::: :: . : ..::.::...:: ::. :::::.: CCDS53 MGSGPLSLPLALSPPRLLLL---LLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVS 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 DVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIW : :...: .:..::. ::: ::.: ::.:.:: :.::::.:.:.:: .. .:.:.. :: CCDS53 DPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIW 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 RPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKF .::::::::: ::: : ::: : . :.: : ::::.::::.::::.:::: ::::::: CCDS53 KPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 GSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFVI :::.::::::::: . : .. :.::::::.:. : : . ::.:: ::::::::.. : CCDS53 GSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 RRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPST ::::::::::::::::::: ::::::::::.::::.:::::::::::::::.::: :::: CCDS53 RRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPST 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 SLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLLMK ::::::::::::::::::::::::::::::::.:.: :::::.::. :::...::...: CCDS53 SLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 RPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAEPG ::. . : .. CCDS53 RPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFSA 360 370 380 390 400 410 >>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa) initn: 1909 init1: 1592 opt: 1620 Z-score: 913.8 bits: 178.9 E(32554): 1.4e-44 Smith-Waterman score: 1690; 48.4% identity (65.3% similar) in 614 aa overlap (11-624:12-501) 10 20 30 40 50 pF1KE2 MELGGPGAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANIS : :: :::: :: . : ..::.::...:: ::. :::::.: CCDS10 MGSGPLSLPLALSPPRLLLL---LLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVS 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 DVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIW : :...: .:..::. ::: ::.: ::.:.:: :.::::.:.:.:: .. .:.:.. :: CCDS10 DPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIW 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 RPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKF .::::::::: ::: : ::: : . :.: : ::::.::::.::::.:::: ::::::: CCDS10 KPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 GSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFVI :::.::::::::: . : .. :.::::::.:. : : . ::.:: ::::::::.. : CCDS10 GSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 RRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPST ::::::::::::::::::: ::::::::::.::::.:::::::::::::::.::: :::: CCDS10 RRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPST 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 SLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLLMK ::::::::::::::::::::::::::::::::.:.: :::::.::. :::...::...: CCDS10 SLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 RPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAEPG ::. . : .. : : . . :. . CCDS10 RPTSNEGNAQK---------------------------------PRPLYGAELS-----N 360 370 420 430 440 450 460 470 pF1KE2 PSCKSPSDQLPPQQPLEAEKASPHPSPGPCRPPHGTQAPGLAKARSLSVQHMSSPGEAVE .: : .:: : : :. . : ... CCDS10 LNCFS-----------RAE------SKG-CKEGYPCQ-------------------DGMC 380 390 400 480 490 500 510 520 530 pF1KE2 GGVRCRSRSIQYCVPRDDAAPEADGQAAGALASRNTHSAELPPPDQPSPCKCTCKKEPSS : :. : :. .. ::.: . :: CCDS10 G--YCHHRRIKI----------------------SNFSANLT-------------RSSSS 410 420 540 550 560 570 580 590 pF1KE2 VSPSATVKTRSTKAPPPHLPLSPALTRAVEGVQYIADHLKAEDTDFSVKEDWKYVAMVID : .:... . ::: . .:...:.:::...::.. ...:::::::::: CCDS10 ESVDAVLSLSA---------LSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVID 430 440 450 460 470 600 610 620 pF1KE2 RIFLWMFIIVCLLGTVGLFLPPWLAGMI :::::.: .::.:::.:::: : .: CCDS10 RIFLWVFTLVCILGTAGLFLQPLMAREDA 480 490 500 >>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa) initn: 1822 init1: 1578 opt: 1578 Z-score: 890.8 bits: 174.7 E(32554): 2.7e-43 Smith-Waterman score: 1613; 47.7% identity (64.2% similar) in 587 aa overlap (37-623:34-488) 10 20 30 40 50 60 pF1KE2 GAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANISDVVLVRF ::::..:::: ::.. ::: :.:: : :.: CCDS61 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIWRPDIVLY ..:.:: .::: ::.: ::.:... :.:::::::: .:... ..:.:.. ::.:::::: CCDS61 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 NNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKFGSWTYDK ::: ::: : ::: : ..: . ::::::.:::: .:.::::::.:::..::::::::: CCDS61 NNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYDK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 AKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFVIRRLPLFY :.:::. . :.::. ::::..:: :.:: : . ::.:: ::: ::::.: :::::.:: CCDS61 AEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMFY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPSTSLVIPLI :::::::::.:: ::::::::::.::::.:::::::::::::::.::: :::::::.::. CCDS61 TINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPLV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 GEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLLMKRPSVVKD ::::::::::::::::.::::::.:.:.: ::::: ::. ::: ..:..:::. CCDS61 GEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMR------- 310 320 330 340 350 370 380 390 400 410 420 pF1KE2 NCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAEPGPSCKSPS :: . : :: : CCDS61 ------------------WPLDK-----TRGTGS-------------------------- 360 430 440 450 460 470 480 pF1KE2 DQLPPQQPLEAEKASPHPSPGPCRPPHGTQAPGLAKARSLSVQHMSSPGEAVEGGVRCRS : .: : : : ::.. ..: :: CCDS61 DAVPR---------------GLARRP--------AKGK------LASHGEP--------- 370 380 490 500 510 520 530 540 pF1KE2 RSIQYCVPRDDAAPEADGQAAGALASRNTHSAELPPPDQPSPCKCTCKKEPSSVSPSATV : .. : . .: :: : :.. : .: : CCDS61 RHLKECF-------------------HCHKSNEL----------ATSKRRLSH-QPLQWV 390 400 410 550 560 570 580 590 600 pF1KE2 KTRSTKAPPPHLPLSPALTRAVEGVQYIADHLKAEDTDFSVKEDWKYVAMVIDRIFLWMF : . :: . ....::.::...:... :..::::::::.::.:::.: CCDS61 VENSEH--------SPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVF 420 430 440 450 460 470 610 620 pF1KE2 IIVCLLGTVGLFLPPWLAGMI ::::..::.:::: : : CCDS61 IIVCVFGTAGLFLQPLLGNTGKS 480 490 >>CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 (468 aa) initn: 1495 init1: 531 opt: 1406 Z-score: 796.4 bits: 157.1 E(32554): 4.9e-38 Smith-Waterman score: 1406; 58.2% identity (78.0% similar) in 364 aa overlap (5-359:7-367) 10 20 30 40 50 pF1KE2 MELGGPGAPRLLPPLLLLLGT--------GLLRASSHVETRAHAEERLLKKLFSGYNK :: : ::: . :. : : :. :. . :. :. ::: ::. :.. CCDS10 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 WSRPVANISDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTS : ::: ...: . ..:::.:.::.:::::::.::::::.:::: : ::::.: :: .. CCDS10 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 IRIPSELIWRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPF ::.::. .: :::::..:::: : : ::. . ..: : ::::: :::::.:::::::: CCDS10 IRVPSDSVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPF 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 DQQNCTMKFGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIY : :::.::::::::: ...:.. . ::. ::...::: ::.:.:. ..: :: : CCDS10 DLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--Y 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 PDITYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLL : .::.:::.:::::::. :::::. .: ::::::::::. :::: :: :::.::::::: CCDS10 PYVTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLL 240 250 260 270 280 290 300 310 320 330 340 pF1KE2 LITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHT-MPTWVRRVFL .: :::::.: :::::::::.::::::::::..:::..:.:::: ::. : ::..:: CCDS10 VIEEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFL 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 DIVPRLLLMKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFC .:.:: :. CCDS10 HTLPKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKENDVREVV 360 370 380 390 400 410 >>CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 (458 aa) initn: 1472 init1: 801 opt: 1399 Z-score: 792.7 bits: 156.4 E(32554): 7.9e-38 Smith-Waterman score: 1399; 59.7% identity (81.2% similar) in 352 aa overlap (11-359:1-350) 10 20 30 40 50 pF1KE2 MELGGPGAPRLLPPLLLLLGT-GL-LRASSHVETRAHAEERLLKKLFSGYNKWSRPVANI .:: ..:.: . :. :.. .. :. :. ::..::.::.:: ::: . CCDS61 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWVRPVLHS 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 SDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELI .:.. : :::.:.::.:::::::.::::::.:::: :.::::.: :: .. ::..::: . CCDS61 NDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 WRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMK : :::::..:::: : . .::. . .: : ::::: :::::..::::::::.:::.:: CCDS61 WLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 FGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFV ::::::: . .::. .. ::. ::...::: :..: : ..:. . :: :::.:: CCDS61 FGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPFITYSFV 180 190 200 210 220 240 250 260 270 280 290 pF1KE2 IRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPS .::::::::. :::::: .: ::::::::::. :::..: :::.:::::::.: ::::: CCDS61 LRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPS 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE2 TSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRT-HTMPTWVRRVFLDIVPRLLL .: ::::::::::: ::::::::..::::.:::::: : : : ::.:.::. .:.:: CCDS61 SSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLLC 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 MKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAE :: CCDS61 MKDHVDRYSSPEKEESQPVVKGKVLEKKKQKQLSDGEKVLVAFLEKAADSIRYISRHVKK 350 360 370 380 390 400 >>CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 (479 aa) initn: 1746 init1: 1373 opt: 1373 Z-score: 778.1 bits: 153.7 E(32554): 5.1e-37 Smith-Waterman score: 1507; 46.3% identity (62.0% similar) in 587 aa overlap (37-623:34-473) 10 20 30 40 50 60 pF1KE2 GAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANISDVVLVRF ::::..:::: ::.. ::: :.:: : :.: CCDS56 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIWRPDIVLY ..:.:: .: :.:::::::: .:... ..:.:.. ::.:::::: CCDS56 EVAITQLANVI---------------WNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY 70 80 90 100 130 140 150 160 170 180 pF1KE2 NNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKFGSWTYDK ::: ::: : ::: : ..: . ::::::.:::: .:.::::::.:::..::::::::: CCDS56 NNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYDK 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE2 AKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFVIRRLPLFY :.:::. . :.::. ::::..:: :.:: : . ::.:: ::: ::::.: :::::.:: CCDS56 AEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMFY 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE2 TINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPSTSLVIPLI :::::::::.:: ::::::::::.::::.:::::::::::::::.::: :::::::.::. CCDS56 TINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPLV 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE2 GEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLLMKRPSVVKD ::::::::::::::::.::::::.:.:.: ::::: ::. ::: ..:..:::. CCDS56 GEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMR------- 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE2 NCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAEPGPSCKSPS :: . : :: : CCDS56 ------------------WPLDK-----TRGTGS-------------------------- 350 430 440 450 460 470 480 pF1KE2 DQLPPQQPLEAEKASPHPSPGPCRPPHGTQAPGLAKARSLSVQHMSSPGEAVEGGVRCRS : .: : : : ::.. ..: :: CCDS56 DAVPR---------------GLARRP--------AKGK------LASHGEP--------- 360 370 490 500 510 520 530 540 pF1KE2 RSIQYCVPRDDAAPEADGQAAGALASRNTHSAELPPPDQPSPCKCTCKKEPSSVSPSATV : .. : . .: :: : :.. : .: : CCDS56 RHLKECF-------------------HCHKSNEL----------ATSKRRLSH-QPLQWV 380 390 400 550 560 570 580 590 600 pF1KE2 KTRSTKAPPPHLPLSPALTRAVEGVQYIADHLKAEDTDFSVKEDWKYVAMVIDRIFLWMF : . :: . ....::.::...:... :..::::::::.::.:::.: CCDS56 VENSEH--------SPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVF 410 420 430 440 450 610 620 pF1KE2 IIVCLLGTVGLFLPPWLAGMI ::::..::.:::: : : CCDS56 IIVCVFGTAGLFLQPLLGNTGKS 460 470 >>CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 (502 aa) initn: 1594 init1: 660 opt: 1358 Z-score: 769.5 bits: 152.2 E(32554): 1.5e-36 Smith-Waterman score: 1443; 44.0% identity (60.1% similar) in 612 aa overlap (14-621:7-481) 10 20 30 40 50 pF1KE2 MELGGPGAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLF--SGYNKWSRPVANI :. :::: :::: : : . .::::...:. : ::: ::..: CCDS10 MARRCGPVALLLGFGLLRLCSGVWG-TDTEERLVEHLLDPSRYNKLIRPATNG 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 SDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELI :..: :.. .:.::::.: :..:.::::::. :::.::.: : : ...:. ..:.::. : CCDS10 SELVTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 WRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMK : ::.:::::::: . :. ..: . .:: . : :::::::.:.:.: ::::::::::: CCDS10 WLPDVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 FGSWTYDKAKIDLVNMHSRVDQLD-FWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAF : :::::...:::: ..:.: .:: : :::: :: : : . : :::: : CCDS10 FRSWTYDRTEIDLV-LKSEVASLDDFTPSGEWDIVALPGRRNENPDDST---YVDITYDF 180 190 200 210 220 240 250 260 270 280 290 pF1KE2 VIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIP .::: ::::::::::::.::. :..:::::::.::::.::::::::.::::::::..:.: CCDS10 IIRRKPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVP 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE2 STSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLL ::: .::.:.::.:::..::.::: .: ::::::::: :::: ::. :::. .: ::. CCDS10 PTSLDVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLF 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 MKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAE :..: . .: : .. : : :: .:. : CCDS10 MQQP---RHHCARQRLRLR------RRQREREG-----AGA-------------LFFREA 350 360 370 380 420 430 440 450 460 470 pF1KE2 PGP-SCKSPSDQLPPQQPLEAEKASPHPSPGPCRPPHGTQAPGLAKARSLSVQHMSSPGE :: :: .. : : : : : :: : :: CCDS10 PGADSCTCFVNRASVQGLAGAFGAEPAPVAGPGRS-----------------------GE 390 400 410 480 490 500 510 520 530 pF1KE2 AVEGGVRCRSRSIQYCVPRDDAAPEADGQAAGALASRNTHSAELPPPDQPSPCKCTCKKE :: : CCDS10 ---------------------------------------------------PCGC----- 420 540 550 560 570 580 590 pF1KE2 PSSVSPSATVKTRSTKAPPPHLPLSPALTRAVEGVQYIADHLKAEDTDFSVKEDWKYVAM .: .::.::..::::...:: : ::.:::::::: CCDS10 --------------------------GLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAM 430 440 450 600 610 620 pF1KE2 VIDRIFLWMFIIVCLLGTVGLFLPPWLAGMI ::::.:::.:..::..::.:.:: : CCDS10 VIDRLFLWIFVFVCVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK 460 470 480 490 500 627 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 20:43:26 2016 done: Sun Nov 6 20:43:26 2016 Total Scan time: 3.030 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]