FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4441, 458 aa 1>>>pF1KE4441 458 - 458 aa - 458 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1347+/-0.00103; mu= 18.8675+/- 0.062 mean_var=68.1654+/-13.650, 0's: 0 Z-trim(103.4): 81 B-trim: 41 in 1/47 Lambda= 0.155343 statistics sampled from 7332 (7415) to 7332 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.594), E-opt: 0.2 (0.228), width: 16 Scan time: 1.950 The best scores are: opt bits E(32554) CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 3044 691.6 4.5e-199 CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 1809 414.8 9.5e-116 CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 1423 328.3 1.2e-89 CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1399 323.0 5.5e-88 CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1303 301.4 1.4e-81 CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1291 298.7 8.7e-81 CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1291 298.7 8.9e-81 CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1265 292.9 4.7e-79 CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 1254 290.4 2.8e-78 CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 1190 276.1 5.8e-74 CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 1157 268.7 9.8e-72 CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1132 263.1 4.6e-70 CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 1106 257.3 2.6e-68 CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 967 226.1 5.9e-59 CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 949 222.1 1.1e-57 CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 949 222.1 1.1e-57 CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 884 207.5 2.5e-53 CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 734 173.9 3.3e-43 CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 726 172.1 1.1e-42 CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 640 152.8 6.3e-37 CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 622 148.8 1.2e-35 CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 605 144.9 1.5e-34 CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 598 143.4 4.7e-34 CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 598 143.4 4.8e-34 CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 590 141.3 7e-34 CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 565 136.0 8.5e-32 CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 558 134.5 2.6e-31 CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 552 133.1 6.4e-31 CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 546 131.8 1.7e-30 CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 543 131.1 2.4e-30 CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 514 124.5 2.1e-28 CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 514 124.6 2.2e-28 CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 504 122.3 1.1e-27 CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 421 103.7 4.3e-22 CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 412 101.6 1.2e-21 CCDS4375.1 GABRP gene_id:2568|Hs108|chr5 ( 440) 333 84.0 3.4e-16 CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 315 79.8 3.4e-15 CCDS75368.1 GABRP gene_id:2568|Hs108|chr5 ( 289) 302 76.9 3e-14 CCDS10019.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 289 74.1 3.4e-13 CCDS4354.1 GABRB2 gene_id:2561|Hs108|chr5 ( 474) 288 73.9 4e-13 CCDS4355.1 GABRB2 gene_id:2561|Hs108|chr5 ( 512) 287 73.7 4.9e-13 CCDS3474.1 GABRB1 gene_id:2560|Hs108|chr4 ( 474) 284 73.0 7.4e-13 CCDS10018.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 283 72.8 8.6e-13 CCDS3796.1 GLRB gene_id:2743|Hs108|chr4 ( 497) 283 72.8 8.9e-13 CCDS54617.1 GABRR3 gene_id:200959|Hs108|chr3 ( 467) 280 72.1 1.4e-12 CCDS3471.1 GABRA2 gene_id:2555|Hs108|chr4 ( 451) 274 70.8 3.3e-12 CCDS82921.1 GABRA2 gene_id:2555|Hs108|chr4 ( 511) 274 70.8 3.7e-12 CCDS54813.1 GLRB gene_id:2743|Hs108|chr4 ( 303) 269 69.5 5.3e-12 CCDS36.1 GABRD gene_id:2563|Hs108|chr1 ( 452) 264 68.5 1.6e-11 CCDS3822.1 GLRA3 gene_id:8001|Hs108|chr4 ( 464) 263 68.3 1.9e-11 >>CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 (458 aa) initn: 3044 init1: 3044 opt: 3044 Z-score: 3687.5 bits: 691.6 E(32554): 4.5e-199 Smith-Waterman score: 3044; 100.0% identity (100.0% similar) in 458 aa overlap (1-458:1-458) 10 20 30 40 50 60 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWVRPVLHSNDTIKVYFGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWVRPVLHSNDTIKVYFGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 KISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESLWLPDIVLFEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESLWLPDIVLFEN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 ADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMKFGSWTYDGTM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 ADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMKFGSWTYDGTM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 VDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYSYPFITYSFVLRRLPLFYTLFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYSYPFITYSFVLRRLPLFYTLFL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 IIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPSSSKVIPLIGEYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 IIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPSSSKVIPLIGEYL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 LFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLLCMKDHVDRYSSPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLLCMKDHVDRYSSPE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 KEESQPVVKGKVLEKKKQKQLSDGEKVLVAFLEKAADSIRYISRHVKKEHFISQVVQDWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KEESQPVVKGKVLEKKKQKQLSDGEKVLVAFLEKAADSIRYISRHVKKEHFISQVVQDWK 370 380 390 400 410 420 430 440 450 pF1KE4 FVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH :::::::::::::::::::::::::::::::::::::: CCDS61 FVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH 430 440 450 >>CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 (468 aa) initn: 2051 init1: 1221 opt: 1809 Z-score: 2191.5 bits: 414.8 E(32554): 9.5e-116 Smith-Waterman score: 2029; 67.6% identity (84.7% similar) in 444 aa overlap (13-453:28-454) 10 20 30 40 pF1KE4 MLPDFMLVLIVLGIPSSATTGFN---SIAENEDALLRHLFQGYQK : ..: :.. :::..::.::. ::: :.. CCDS10 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE4 WVRPVLHSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHS ::::: : :: ::. ::: :::::::::::::::::::::::: : ::::::::::::. CCDS10 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE4 IKVPSESLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPF :.:::.:.: ::::::.::::::::. ::.... ::::.:::::.::::::.::::::: CCDS10 IRVPSDSVWTPDIVLFDNADGRFEGT-STKTVIRYNGTVTWTPPANYKSSCTIDVTFFPF 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 DRQNCSMKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYSYPF : ::::::::::::::..::.:: ...::..::::::::::..: : :::: :. ::. CCDS10 DLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCWYPY 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 ITYSFVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVI .:::::..::::::::::::::.::::::::::::::.::::. : :::::::::::::: CCDS10 VTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVI 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE4 EEIIPSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQK ::::::::::::::::::.: ::::::::.::::.::.:::::::.. ::: :...::. CCDS10 EEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHT 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE4 LPKLLCMKDHVDRYSSPEKEESQPVVKGKVLEKKKQKQLSDGEKVLVAFLEKAADSIRYI :::::::..::::: . .:::.. ..: : :: : :::::: CCDS10 LPKLLCMRSHVDRYFT-QKEETES---------------GSGPKSSRNTLEAALDSIRYI 360 370 380 390 400 410 420 430 440 450 pF1KE4 SRHVKKEHFISQVVQDWKFVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH .::. ::. . .::.::::.::::::.::: ::.::..::. .:.:.. : CCDS10 TRHIMKENDVREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHI 410 420 430 440 450 460 CCDS10 GNANK >>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa) initn: 1579 init1: 860 opt: 1423 Z-score: 1723.2 bits: 328.3 E(32554): 1.2e-89 Smith-Waterman score: 1558; 52.4% identity (74.0% similar) in 477 aa overlap (15-446:46-520) 10 20 30 40 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWV :.. : .: .:.:: :..:::.::..:. CCDS60 LWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQG-GSHTETEDRLFKHLFRGYNRWA 20 30 40 50 60 70 50 60 70 80 90 100 pF1KE4 RPVLHSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIK ::: ...:.. : :::.:.::.:::::::.:::::::::::.:.:::::: :.:.: :.. CCDS60 RPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLR 80 90 100 110 120 130 110 120 130 140 150 160 pF1KE4 VPSESLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDR :::: .:.:::::..::::.: . :::. . :.::: :.::: :::::..::::::::. CCDS60 VPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQ 140 150 160 170 180 190 170 180 190 200 210 220 pF1KE4 QNCSMKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPF :::.::::::::: . .:: ....:: ::....::: :.:: : .... . :: CCDS60 QNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPD 200 210 220 230 240 250 230 240 250 260 270 280 pF1KE4 ITYSFVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVI .::.::.::::::::. :::::: .: ::::::::::: :::..: :::.:::::::.: CCDS60 VTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLI 260 270 280 290 300 310 290 300 310 320 330 340 pF1KE4 EEIIPSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQK :::::.: ::::::::::: ::::::::..::::.:::::: :: : : ::. .: CCDS60 TEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPST-HTMPHWVRGALLGC 320 330 340 350 360 370 350 360 370 pF1KE4 LPKLLCMKD--------HVDRYS-SP---------EKEESQPVVK--------GKVLEK- .:. : :. : : . :: . :: . ::. :.: . CCDS60 VPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSV 380 390 400 410 420 430 380 390 400 410 pF1KE4 ----------------KKQKQLSDGEKVLVAFLEKAADSIRYISRHVKKEHFISQVVQDW : . :..:: .: ..:: ....::. :...: :.: .:: CCDS60 GTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDW 440 450 460 470 480 490 420 430 440 450 pF1KE4 KFVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH :.::.:.::::::::.:: :.. .: CCDS60 KYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 500 510 520 >>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa) initn: 1472 init1: 801 opt: 1399 Z-score: 1693.1 bits: 323.0 E(32554): 5.5e-88 Smith-Waterman score: 1399; 59.7% identity (81.0% similar) in 352 aa overlap (1-350:11-359) 10 20 30 40 50 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWVRPVLHS .:: .:.:. :. :.. .. :. :. ::..::.::.:: ::: . CCDS13 MELGGPGAPRLLPP-LLLLLGTGL-LRASSHVETRAHAEERLLKKLFSGYNKWSRPVANI 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 NDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESL .:.. : :::.:.::.:::::::.::::::.:::: :.::::.: :: .. ::..::: . CCDS13 SDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 WLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMK : :::::..:::: : . .::. . .: : ::::: :::::..::::::::.:::.:: CCDS13 WRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMK 120 130 140 150 160 170 180 190 200 210 220 pF1KE4 FGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPFITYSFV ::::::: . .::. .. ::. ::...::: :..: : ..:. . :: :::.:: CCDS13 FGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFV 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 LRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPS .::::::::. :::::: .: ::::::::::. :::..: :::.:::::::.: ::::: CCDS13 IRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE4 SSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLLC .: ::::::::::: ::::::::..::::.:::::: : : : ::.:.::. .:.:: CCDS13 TSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRT-HTMPTWVRRVFLDIVPRLLL 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE4 MKDHVDRYSSPEKEESQPVVKGKVLEKKKQKQLSDGEKVLVAFLEKAADSIRYISRHVKK :: CCDS13 MKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAE 360 370 380 390 400 410 >>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa) initn: 1431 init1: 735 opt: 1303 Z-score: 1578.3 bits: 301.4 E(32554): 1.4e-81 Smith-Waterman score: 1403; 47.6% identity (75.0% similar) in 456 aa overlap (29-450:34-487) 10 20 30 40 50 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWVRPVLHSNDTIKVYF :. :...::. :....::: . .: . :.: CCDS61 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 GLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESLWLPDIVLF . :.::..::: ::.: ::.::.. :.:.::::.: .: ::....::....: :::::. CCDS61 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 ENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMKFGSWTYDG .:: : :. ::...: :: ..::::: .:::: ::.::::::.::::.:::::::: CCDS61 NNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYDK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 TMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPFITYSFVLRRLPLFY . .::..:. .:: .::..:.::::..:.:.: . . . : ::::: .::::.:: CCDS61 AEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMFY 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 TLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPSSSKVIPLI :. :::::: .::::::::::::: :::..: :::.::::::::: : :::.: :.::. CCDS61 TINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPLV 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 GEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLLCMKDHVDRY :::::: ::::::::.:::::.:.:.:. .: : : ::: .::. ::..: :. .:. CCDS61 GEYLLFTMIFVTLSIVVTVFVLNIHYRTPTT-HTMPRWVKTVFLKLLPQVLLMRWPLDKT 310 320 330 340 350 360 360 370 380 pF1KE4 SS------PEKEESQPVVKGKV------------LEKKKQKQLSDGEKVLV--------- . :. .:. :::. .. .:...:. ... : CCDS61 RGTGSDAVPRGLARRPA-KGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVVE 370 380 390 400 410 420 390 400 410 420 430 440 pF1KE4 -----AFLEKAADSIRYISRHVKKEHFISQVVQDWKFVAQVLDRIFLWLFLIVSVTGSVL .: . .:...:....:... ..: .:::.::.:.::.:::.:.:: : :.. CCDS61 NSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCVFGTAG 430 440 450 460 470 480 450 pF1KE4 IFTPALKMWLHSYH .: : CCDS61 LFLQPLLGNTGKS 490 >>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa) initn: 1300 init1: 722 opt: 1291 Z-score: 1563.8 bits: 298.7 E(32554): 8.7e-81 Smith-Waterman score: 1291; 53.0% identity (77.9% similar) in 366 aa overlap (3-366:15-369) 10 20 30 40 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWVRPVL : ..:.:.. .: . .. : : :...::. :.. .::: CCDS53 MGSGPLSLPLALSPPRLLLLLLLSLLPVARAS------EAEHRLFERLFEDYNEIIRPVA 10 20 30 40 50 50 60 70 80 90 100 pF1KE4 HSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSE . .: . ..: ...:::: ::: ::.: ::.:::: :.:.::.:::.:::: . ..::.. CCDS53 NVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQ 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE4 SLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCS ..: :::::..:: : :. . ::...: .: :.: ::: .:::: .:::.:::: :::. CCDS53 KIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 MKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPFITYS ::::::.:: . .::.::. ... ::....::: :..: :.: . . . :: :::: CCDS53 MKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 FVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEII . .::::::::. :::::: .::::::::::::: :::..: :::.::::::::: : : CCDS53 LYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETI 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE4 PSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKL ::.: ::::::::::: ::::::::..::::.:::.:. .: : : ::: .::. ::.. CCDS53 PSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTT-HTMPSWVKTVFLNLLPRV 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE4 LCMKDHVDRYSSPEKEESQPVVKGKVLEKKKQKQLSDGEKVLVAFLEKAADSIRYISRHV . : : .: : . ..: CCDS53 MFMT----RPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRR 360 370 380 390 400 >>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa) initn: 1442 init1: 722 opt: 1291 Z-score: 1563.6 bits: 298.7 E(32554): 8.9e-81 Smith-Waterman score: 1380; 45.3% identity (71.7% similar) in 488 aa overlap (3-446:15-495) 10 20 30 40 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWVRPVL : ..:.:.. .: . .. : : :...::. :.. .::: CCDS10 MGSGPLSLPLALSPPRLLLLLLLSLLPVARAS------EAEHRLFERLFEDYNEIIRPVA 10 20 30 40 50 50 60 70 80 90 100 pF1KE4 HSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSE . .: . ..: ...:::: ::: ::.: ::.:::: :.:.::.:::.:::: . ..::.. CCDS10 NVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQ 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE4 SLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCS ..: :::::..:: : :. . ::...: .: :.: ::: .:::: .:::.:::: :::. CCDS10 KIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 MKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPFITYS ::::::.:: . .::.::. ... ::....::: :..: :.: . . . :: :::: CCDS10 MKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 FVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEII . .::::::::. :::::: .::::::::::::: :::..: :::.::::::::: : : CCDS10 LYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETI 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE4 PSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKL ::.: ::::::::::: ::::::::..::::.:::.:. .: : : ::: .::. ::.. CCDS10 PSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTT-HTMPSWVKTVFLNLLPRV 300 310 320 330 340 350 350 360 370 pF1KE4 LCMK--------------------DHVDRYSSPEKE---ESQPVVKG----------KV- . : .... .: :.. :. : : :. CCDS10 MFMTRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKIS 360 370 380 390 400 410 380 390 400 410 420 pF1KE4 -----LEKKKQKQLSDGEKVLVAF---LEKAADSIRYISRHVKKEHFISQVVQDWKFVAQ : ...... :. : :. ...: .:..::....: .. ... .:::.::. CCDS10 NFSANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAM 420 430 440 450 460 470 430 440 450 pF1KE4 VLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH :.::::::.: .: . :.. .: CCDS10 VIDRIFLWVFTLVCILGTAGLFLQPLMAREDA 480 490 500 >>CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 (457 aa) initn: 1255 init1: 674 opt: 1265 Z-score: 1532.8 bits: 292.9 E(32554): 4.7e-79 Smith-Waterman score: 1265; 43.9% identity (75.6% similar) in 442 aa overlap (16-450:11-450) 10 20 30 40 50 60 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWVRPVLHSNDTIKVYFGL : ..:. .:.: :. .::. :.. :::: ....: :: CCDS22 MEPWPLLLLFSLCSAGLVLGSEHETRLVAKLFKDYSSVVRPVEDHRQVVEVTVGL 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 KISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESLWLPDIVLFEN .. ::..::: ::..:::: :::.:.:..:.::::::::...:..:::..: ::.::..: CCDS22 QLIQLINVDEVNQIVTTNVRLKQQWVDYNLKWNPDDYGGVKKIHIPSEKIWRPDLVLYNN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 ADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMKFGSWTYDGTM ::: : .:::... .: ..::::: .:: : . :: ::::.::::::.:.:::::.. CCDS22 ADGDFAIVKFTKVLLQYTGHITWTPPAIFKSYCEIIVTHFPFDEQNCSMKLGTWTYDGSV 120 130 140 150 160 170 190 200 210 220 230 pF1KE4 VDLILINENVDRKDFFDNGEWEILNAKGMKGN-RRDGVYSYPF--ITYSFVLRRLPLFYT : . ... : ..:...::: : ...: : . . . :. ::: ::..::::.. CCDS22 VAINPESDQPDLSNFMESGEWVIKESRGWKHSVTYSCCPDTPYLDITYHFVMQRLPLYFI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 LFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPSSSKVIPLIG . .::::: .:::: ::::::.: :::..:: :::.::::::::: :.:::.:...:::: CCDS22 VNVIIPCLLFSFLTGLVFYLPTDSGEKMTLSISVLLSLTVFLLVIVELIPSTSSAVPLIG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 EYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLL---CMKDHVD .:.:: :.:: :::.::.:::.:::: :: : : ::...:.. .:... :: . . CCDS22 KYMLFTMVFVIASIIITVIVINTHHRSPST-HVMPNWVRKVFIDTIPNIMFFSTMK-RPS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 RYSSPEKEESQPVVKGKVLEKKKQKQLS-DGEKVLVAFLEKAADSIRYISRHVKKEHFIS : .. .: .. . . . : .. . . ...: ..:.::.. .:... . CCDS22 REKQDKKIFTEDIDISDISGKPGPPPMGFHSPLIKHPEVKSAIEGIKYIAETMKSDQESN 360 370 380 390 400 410 420 430 440 450 pF1KE4 QVVQDWKFVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH ... .::.::.:.:.:.: .:..: . :.. .:. : CCDS22 NAAAEWKYVAMVMDHILLGVFMLVCIIGTLAVFAGRLIELNQQG 420 430 440 450 >>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa) initn: 1517 init1: 703 opt: 1254 Z-score: 1518.7 bits: 290.4 E(32554): 2.8e-78 Smith-Waterman score: 1462; 50.7% identity (71.3% similar) in 477 aa overlap (15-446:46-505) 10 20 30 40 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWV :.. : .: .:.:: :..:::.::..:. CCDS64 LWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQG-GSHTETEDRLFKHLFRGYNRWA 20 30 40 50 60 70 50 60 70 80 90 100 pF1KE4 RPVLHSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIK ::: ...: ::::::.:::::::::::.:.:::::: :.:.: :.. CCDS64 RPVPNTSD---------------VDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLR 80 90 100 110 110 120 130 140 150 160 pF1KE4 VPSESLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDR :::: .:.:::::..::::.: . :::. . :.::: :.::: :::::..::::::::. CCDS64 VPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQ 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 QNCSMKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPF :::.::::::::: . .:: ....:: ::....::: :.:: : .... . :: CCDS64 QNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPD 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 ITYSFVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVI .::.::.::::::::. :::::: .: ::::::::::: :::..: :::.:::::::.: CCDS64 VTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLI 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE4 EEIIPSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQK :::::.: ::::::::::: ::::::::..::::.:::::: :: : : ::. .: CCDS64 TEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPST-HTMPHWVRGALLGC 300 310 320 330 340 350 350 360 370 pF1KE4 LPKLLCMKD--------HVDRYS-SP---------EKEESQPVVK--------GKVLEK- .:. : :. : : . :: . :: . ::. :.: . CCDS64 VPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSV 360 370 380 390 400 410 380 390 400 410 pF1KE4 ----------------KKQKQLSDGEKVLVAFLEKAADSIRYISRHVKKEHFISQVVQDW : . :..:: .: ..:: ....::. :...: :.: .:: CCDS64 GTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDW 420 430 440 450 460 470 420 430 440 450 pF1KE4 KFVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH :.::.:.::::::::.:: :.. .: CCDS64 KYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 480 490 500 510 >>CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 (498 aa) initn: 1229 init1: 667 opt: 1190 Z-score: 1441.4 bits: 276.1 E(32554): 5.8e-74 Smith-Waterman score: 1294; 43.0% identity (71.7% similar) in 467 aa overlap (21-450:19-482) 10 20 30 40 50 pF1KE4 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQG--YQKWVRPVLHSNDTIKVYF : .:. :. :. :.. :.. .::. :.. :.. . CCDS10 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQLISIKL 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 GLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESLWLPDIVLF :...::..:.:..:.:::::::::::::..: :: . : :.. ...:.. .:::::::. CCDS10 QLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLPDIVLY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 ENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMKFGSWTYDG .:::: .: :..:..::.:::.:.: ::: :::.: ..: .::::.:::..:: ::::: CCDS10 NNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRSWTYDH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 TMVDLILINENVDRKDFFDNGEWEILNAKGMKG-NRRDGVYSYPFITYSFVLRRLPLFYT : .:..:.. ... :: .:::.:. : . : .: :: .::.:...: ::::: CCDS10 TEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQDP--SYVDVTYDFIIKRKPLFYT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 LFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPSSSKVIPLIG . :::::. ..:..:::::::: :::..: :::..:: :::.: .:.: .: .:::: CCDS10 INLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSLDVPLIG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 EYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLLCMK----DHV .::.: :..::.::...: :.:::::: :: : ::::::: ::.::: .: :: : CCDS10 KYLMFTMVLVTFSIVTSVCVLNVHHRSPST-HTMAPWVKRCFLHKLPTFLFMKRPGPDSS 300 310 320 330 340 350 360 370 380 390 pF1KE4 DRYSSPEKEE--SQPVVK----------GKVL-----EKKKQKQLSDGEKVLVA--F--- . : .. ..: . :. . . .:. . . : . : CCDS10 PARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAGSTPVAIPRDFWLR 360 370 380 390 400 410 400 410 420 430 440 pF1KE4 --------LEKAADSIRYISRHVKKEHFISQVVQDWKFVAQVLDRIFLWLFLIVSVTGSV ...: ... .:..:.:.. ..::.:::.::.:.::.:::.:..: : :.: CCDS10 SSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLFLWVFMFVCVLGTV 420 430 440 450 460 470 450 pF1KE4 LIFTPALKMWLHSYH .: : : CCDS10 GLFLPPLFQTHAASEGPYAAQRD 480 490 458 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:37:20 2016 done: Sun Nov 6 00:37:21 2016 Total Scan time: 1.950 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]