FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4451, 468 aa 1>>>pF1KE4451 468 - 468 aa - 468 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4078+/-0.000895; mu= 16.9031+/- 0.054 mean_var=63.4970+/-13.065, 0's: 0 Z-trim(105.0): 75 B-trim: 489 in 1/48 Lambda= 0.160952 statistics sampled from 8135 (8212) to 8135 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.616), E-opt: 0.2 (0.252), width: 16 Scan time: 3.050 The best scores are: opt bits E(32554) CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 3131 735.9 2e-212 CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1809 429.0 5.1e-120 CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1406 335.5 1e-91 CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 1397 333.3 3.7e-91 CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1324 316.4 4.4e-86 CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1300 310.8 2.1e-84 CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1300 310.8 2.1e-84 CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 1247 298.5 1.1e-80 CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1207 289.2 6.2e-78 CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 1151 276.2 5.5e-74 CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1138 273.2 4.3e-73 CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 1115 267.8 1.8e-71 CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 1032 248.6 1.1e-65 CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 1024 246.5 1.5e-65 CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 946 228.6 1.2e-59 CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 944 228.1 1.7e-59 CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 936 226.3 5.6e-59 CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 899 217.7 2.1e-56 CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 701 171.7 1.5e-42 CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 698 171.0 2.4e-42 CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 644 158.4 1.3e-38 CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 621 153.1 6.3e-37 CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 620 152.9 6.4e-37 CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 538 133.9 4e-31 CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 522 130.1 4.7e-30 CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 522 130.1 4.8e-30 CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 504 126.0 9.2e-29 CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 486 121.8 1.6e-27 CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 484 121.3 2.1e-27 CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 444 112.0 1.5e-24 CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 441 111.3 2.3e-24 CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 433 109.4 7.6e-24 CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 433 109.5 7.8e-24 CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 428 108.2 1.3e-23 CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 362 93.0 7.5e-19 CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 321 83.3 2.9e-16 CCDS10018.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 291 76.5 6.8e-14 CCDS4375.1 GABRP gene_id:2568|Hs108|chr5 ( 440) 288 75.8 1e-13 CCDS4354.1 GABRB2 gene_id:2561|Hs108|chr5 ( 474) 274 72.5 1.1e-12 CCDS4355.1 GABRB2 gene_id:2561|Hs108|chr5 ( 512) 274 72.6 1.1e-12 CCDS10019.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 273 72.3 1.2e-12 CCDS3796.1 GLRB gene_id:2743|Hs108|chr4 ( 497) 263 70.0 6.4e-12 CCDS54617.1 GABRR3 gene_id:200959|Hs108|chr3 ( 467) 262 69.8 7.2e-12 CCDS3474.1 GABRB1 gene_id:2560|Hs108|chr4 ( 474) 260 69.3 1e-11 CCDS3471.1 GABRA2 gene_id:2555|Hs108|chr4 ( 451) 259 69.0 1.1e-11 CCDS54942.1 GLRA1 gene_id:2741|Hs108|chr5 ( 457) 259 69.1 1.1e-11 CCDS43980.2 GLRA4 gene_id:441509|Hs108|chrX ( 417) 258 68.8 1.2e-11 CCDS82921.1 GABRA2 gene_id:2555|Hs108|chr4 ( 511) 259 69.1 1.3e-11 CCDS54813.1 GLRB gene_id:2743|Hs108|chr4 ( 303) 249 66.7 4e-11 CCDS45194.1 GABRA5 gene_id:2558|Hs108|chr15 ( 462) 251 67.2 4.2e-11 >>CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 (468 aa) initn: 3131 init1: 3131 opt: 3131 Z-score: 3927.0 bits: 735.9 E(32554): 2e-212 Smith-Waterman score: 3131; 100.0% identity (100.0% similar) in 468 aa overlap (1-468:1-468) 10 20 30 40 50 60 pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 IRVPSDSVWTPDIVLFDNADGRFEGTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 IRVPSDSVWTPDIVLFDNADGRFEGTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 LQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCWYPYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCWYPYV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 TYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 EIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 EIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 PKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKENDVREVVEDW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKENDVREVVEDW 370 380 390 400 410 420 430 440 450 460 pF1KE4 KFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK :::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK 430 440 450 460 >>CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 (458 aa) initn: 2051 init1: 1221 opt: 1809 Z-score: 2268.1 bits: 429.0 E(32554): 5.1e-120 Smith-Waterman score: 2029; 67.6% identity (84.7% similar) in 444 aa overlap (28-454:13-453) 10 20 30 40 50 60 pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER : ..: :. .:::..::.::. ::: :.. CCDS61 MLPDFMLVLIVLGIPSSATTGF---NSIAENEDALLRHLFQGYQK 10 20 30 40 70 80 90 100 110 120 pF1KE4 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV ::::: : :: ::. ::: :::::::::::::::::::::::: : ::::::::::::. CCDS61 WVRPVLHSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHS 50 60 70 80 90 100 130 140 150 160 170 pF1KE4 IRVPSDSVWTPDIVLFDNADGRFEGT-STKTVIRYNGTVTWTPPANYKSSCTIDVTFFPF :.:::.:.: ::::::.::::::::. ::.... ::::.:::::.::::::.::::::: CCDS61 IKVPSESLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPF 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 DLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCWYPY : ::::::::::::::..::.:: ...::..::::::::::..: : :::: :. ::. CCDS61 DRQNCSMKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYSYPF 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 VTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVI .:::::..::::::::::::::.::::::::::::::.::::. : :::::::::::::: CCDS61 ITYSFVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVI 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 EEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHT ::::::::::::::::::.: ::::::::.::::.::.:::::::.. ::: :...::. CCDS61 EEIIPSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQK 290 300 310 320 330 340 360 370 380 390 400 pF1KE4 LPKLLCMRSHVDRYFT-QKEETES---------------GSGPKSSRNTLEAALDSIRYI :::::::..::::: . .:::.. ..: : :: : :::::: CCDS61 LPKLLCMKDHVDRYSSPEKEESQPVVKGKVLEKKKQKQLSDGEKVLVAFLEKAADSIRYI 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE4 TRHIMKENDVREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHI .::. ::. . .::.::::.::::::.::: ::.::..::. .:.:.. : CCDS61 SRHVKKEHFISQVVQDWKFVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH 410 420 430 440 450 pF1KE4 GNANK >>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa) initn: 1495 init1: 531 opt: 1406 Z-score: 1760.3 bits: 335.5 E(32554): 1e-91 Smith-Waterman score: 1406; 58.2% identity (78.0% similar) in 364 aa overlap (7-367:5-359) 10 20 30 40 50 60 pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER :: : ::: . :. : : :. :. . :. :. ::: ::. :.. CCDS13 MELGGPGAPRLLPPLLLLLGT--------GLLRASSHVETRAHAEERLLKKLFSGYNK 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV : ::: ...: . ..:::.:.::.:::::::.::::::.:::: : ::::.: :: .. CCDS13 WSRPVANISDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTS 60 70 80 90 100 110 130 140 150 160 170 pF1KE4 IRVPSDSVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPF ::.::. .: :::::..:::: : : ::. . ..: : ::::: :::::.:::::::: CCDS13 IRIPSELIWRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 DLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--Y : :::.::::::::: ...:.. . ::. ::...::: ::.:.:. ..: :: : CCDS13 DQQNCTMKFGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 PYVTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLL : .::.:::.:::::::. :::::. .: ::::::::::. :::: :: :::.::::::: CCDS13 PDITYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 VIEEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFL .: :::::.: :::::::::.::::::::::..:::..:.:::: ::. : ::..:: CCDS13 LITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHT-MPTWVRRVFL 300 310 320 330 340 360 370 380 390 400 410 pF1KE4 HTLPKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKENDVREVV .:.:: :. CCDS13 DIVPRLLLMKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFC 350 360 370 380 390 400 >>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa) initn: 1554 init1: 540 opt: 1397 Z-score: 1750.1 bits: 333.3 E(32554): 3.7e-91 Smith-Waterman score: 1464; 51.1% identity (70.7% similar) in 468 aa overlap (37-442:49-515) 10 20 30 40 50 60 pF1KE4 GPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVE : . .: .. :: :.: ::. :.::.::: CCDS60 LLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARPVP 20 30 40 50 60 70 70 80 90 100 110 120 pF1KE4 HLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSD . .: . ..:::.:.::.:::::::.::::::::::: : :::::: :.:.: .::::. CCDS60 NTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSE 80 90 100 110 120 130 130 140 150 160 170 180 pF1KE4 SVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCS .: :::::..::::.: : ::. . .::: :.::: :::::.::::::::: :::. CCDS60 MIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCK 140 150 160 170 180 190 190 200 210 220 230 240 pF1KE4 MKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYS ::::::::: ...:. .: :: .:....::: ::.:::. ... .:: :: :::. CCDS60 MKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYA 200 210 220 230 240 250 250 260 270 280 290 300 pF1KE4 FVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEII :::.:::::::. :::::. .: ::::::::::. :::: :: :::.:::::::.: ::: CCDS60 FVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEII 260 270 280 290 300 310 310 320 330 340 350 360 pF1KE4 PSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKL ::.: :::::::::.::::::::::..:::..:.:::: :::. : :: .: .:. CCDS60 PSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHT-MPHWVRGALLGCVPRW 320 330 340 350 360 370 370 380 pF1KE4 L-----------C-------------MRSHVD---RYFTQKEETE--------------- : : ..:.:: : . .:: . CCDS60 LLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLC 380 390 400 410 420 430 390 400 410 420 pF1KE4 ------SG-SGPKSS----------RNTLEAALDSIRYITRHIMKENDVREVVEDWKFIA :: ::::. .. ::....::. :. .:. : ::::..: CCDS60 SHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVA 440 450 460 470 480 490 430 440 450 460 pF1KE4 QVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK .:.::.::: :..: ..: CCDS60 MVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 500 510 520 >>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa) initn: 1440 init1: 517 opt: 1324 Z-score: 1659.0 bits: 316.4 E(32554): 4.4e-86 Smith-Waterman score: 1411; 47.3% identity (73.1% similar) in 457 aa overlap (47-451:34-488) 20 30 40 50 60 70 pF1KE4 VQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVEHLNDKIKIKF :. :.. ::. :....::::...: . ..: CCDS61 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE4 GLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSDSVWTPDIVLF .::.::..::: ::.: ::.::.. : : ::::.: .: ::...:::.:..: :::::. CCDS61 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE4 DNADGRF--EGTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCSMKFGSWTYD .:: : : :: .::....::: .:::::: .:::: .:.:::::: ::::.:::::::: CCDS61 NNAVGDFQVEG-KTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYD 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE4 GSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYSFVIKRLPLF ...:... . :: ::..:.::::..:.: : . .:: : .:::: :.:::.: CCDS61 KAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMF 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE4 YTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEIIPSSSKVIPL ::. :::::. .::::::::::::. :::. :: :::.::::::::: : :::.: :.:: CCDS61 YTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPL 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE4 IGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKLLCMRSHVDR .::::.::::::::::.::::..:::.:. .::. : :. .::. ::..: :: .:. CCDS61 VGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHT-MPRWVKTVFLKLLPQVLLMRWPLDK 310 320 330 340 350 360 380 390 pF1KE4 --------------YFTQKEETESGSGPK---------------SSRNTL---------- : . : . :. .:. : CCDS61 TRGTGSDAVPRGLARRPAKGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVVE 370 380 390 400 410 420 400 410 420 430 440 pF1KE4 --------EAALDSIRYITRHIMKENDVREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLG : ...:...:.... ..:...:: .:::..:.:.::.:::.:..: . :. : CCDS61 NSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCVFGTAG 430 440 450 460 470 480 450 460 pF1KE4 LFV-PVIYKWANILIPVHIGNANK ::. :.. CCDS61 LFLQPLLGNTGKS 490 >>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa) initn: 1332 init1: 523 opt: 1300 Z-score: 1628.9 bits: 310.8 E(32554): 2.1e-84 Smith-Waterman score: 1301; 53.6% identity (77.2% similar) in 364 aa overlap (6-366:13-356) 10 20 30 40 50 pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKD : :: : :::: : ..: .: :.:. :.. CCDS53 MGSGPLSLPLALSPPRLLLLLLLSLLPVAR-----------------ASEAEHR--LFER 10 20 30 40 60 70 80 90 100 110 pF1KE4 LFQDYERWVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPD ::.::.. .::: ...: . :.: ...:::: ::: ::.: ::.:::: : : ::.:::. CCDS53 LFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPS 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 DYGGIKVIRVPSDSVWTPDIVLFDNADGRFE-GTSTKTVIRYNGTVTWTPPANYKSSCTI :::: . .:::....: :::::..:: : :. .::....:.: ::: ::: .:::: : CCDS53 DYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKI 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 DVTFFPFDLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTD :::.:::: :::.::::::.:: ...:..: .... .:....::: :..: : : . CCDS53 DVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKY 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 SCCW--YPYVTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLV .:: :: .:::. :.:::::::. :::::. .::::::::::::. :::. :: :::. CCDS53 NCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLL 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 SLTVFLLVIEEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAP ::::::::: : :::.: :::::::::.::::::::::..:::..:.:.:. .::. : CCDS53 SLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHT-MPS 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE4 LVRKIFLHTLPKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKE :. .::. ::... : CCDS53 WVKTVFLNLLPRVMFMTRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDG 350 360 370 380 390 400 >>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa) initn: 1470 init1: 523 opt: 1300 Z-score: 1628.7 bits: 310.8 E(32554): 2.1e-84 Smith-Waterman score: 1363; 44.9% identity (68.5% similar) in 499 aa overlap (6-443:13-491) 10 20 30 40 50 pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKD : :: : :::: : ..: .: :.:. :.. CCDS10 MGSGPLSLPLALSPPRLLLLLLLSLLPVAR-----------------ASEAEHR--LFER 10 20 30 40 60 70 80 90 100 110 pF1KE4 LFQDYERWVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPD ::.::.. .::: ...: . :.: ...:::: ::: ::.: ::.:::: : : ::.:::. CCDS10 LFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPS 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 DYGGIKVIRVPSDSVWTPDIVLFDNADGRFE-GTSTKTVIRYNGTVTWTPPANYKSSCTI :::: . .:::....: :::::..:: : :. .::....:.: ::: ::: .:::: : CCDS10 DYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKI 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 DVTFFPFDLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTD :::.:::: :::.::::::.:: ...:..: .... .:....::: :..: : : . CCDS10 DVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKY 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 SCCW--YPYVTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLV .:: :: .:::. :.:::::::. :::::. .::::::::::::. :::. :: :::. CCDS10 NCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLL 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 SLTVFLLVIEEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAP ::::::::: : :::.: :::::::::.::::::::::..:::..:.:.:. .::. : CCDS10 SLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHT-MPS 290 300 310 320 330 340 360 370 380 pF1KE4 LVRKIFLHTLPKLLCM-RSHVDRYFTQKEETESGS--------------GPK-------- :. .::. ::... : : .. .:: . :. : : CCDS10 WVKTVFLNLLPRVMFMTRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDG 350 360 370 380 390 400 390 400 410 pF1KE4 ----------------------SSRNTLEA-------------ALDSIRYITRHIMKEND :: ....: :..:..::.... .:. CCDS10 MCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNE 410 420 430 440 450 460 420 430 440 450 460 pF1KE4 VREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK ..:. .:::..:.:.::.:::.: .: :.:. CCDS10 AKEIQDDWKYVAMVIDRIFLWVFTLVCILGTAGLFLQPLMAREDA 470 480 490 500 >>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa) initn: 1408 init1: 540 opt: 1247 Z-score: 1562.1 bits: 298.5 E(32554): 1.1e-80 Smith-Waterman score: 1367; 49.6% identity (67.9% similar) in 468 aa overlap (37-442:49-500) 10 20 30 40 50 60 pF1KE4 GPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVE : . .: .. :: :.: ::. :.::.::: CCDS64 LLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARPVP 20 30 40 50 60 70 70 80 90 100 110 120 pF1KE4 HLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSD . .: ::::::.::::::::::: : :::::: :.:.: .::::. CCDS64 NTSD---------------VDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSE 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 SVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCS .: :::::..::::.: : ::. . .::: :.::: :::::.::::::::: :::. CCDS64 MIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 MKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYS ::::::::: ...:. .: :: .:....::: ::.:::. ... .:: :: :::. CCDS64 MKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 FVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEII :::.:::::::. :::::. .: ::::::::::. :::: :: :::.:::::::.: ::: CCDS64 FVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEII 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKL ::.: :::::::::.::::::::::..:::..:.:::: :::. : :: .: .:. CCDS64 PSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHT-MPHWVRGALLGCVPRW 310 320 330 340 350 360 370 380 pF1KE4 L-----------C-------------MRSHVD---RYFTQKEETE--------------- : : ..:.:: : . .:: . CCDS64 LLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLC 370 380 390 400 410 420 390 400 410 420 pF1KE4 ------SG-SGPKSS----------RNTLEAALDSIRYITRHIMKENDVREVVEDWKFIA :: ::::. .. ::....::. :. .:. : ::::..: CCDS64 SHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVA 430 440 450 460 470 480 430 440 450 460 pF1KE4 QVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK .:.::.::: :..: ..: CCDS64 MVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 490 500 510 >>CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 (457 aa) initn: 1263 init1: 447 opt: 1207 Z-score: 1512.7 bits: 289.2 E(32554): 6.2e-78 Smith-Waterman score: 1300; 46.6% identity (74.5% similar) in 427 aa overlap (44-447:21-446) 20 30 40 50 60 70 pF1KE4 LLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVEHLNDKIK ..:: :. ::.:: ::::: . .. CCDS22 MEPWPLLLLFSLCSAGLVLGSEHETRLVAKLFKDYSSVVRPVEDHRQVVE 10 20 30 40 50 80 90 100 110 120 130 pF1KE4 IKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSDSVWTPDI . :: . ::..::: ::..:::: :::.:.: .:.::::::::.: :..::...: ::. CCDS22 VTVGLQLIQLINVDEVNQIVTTNVRLKQQWVDYNLKWNPDDYGGVKKIHIPSEKIWRPDL 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE4 VLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCSMKFGSWT ::..:::: : .. ::....:.: .:::::: .:: : : :: :::: ::::::.:.:: CCDS22 VLYNNADGDFAIVKFTKVLLQYTGHITWTPPAIFKSYCEIIVTHFPFDEQNCSMKLGTWT 120 130 140 150 160 170 200 210 220 230 240 pF1KE4 YDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW-YPY--VTYSFVIKRL :::: : : :... : .:...::: : . : : . : ::: :: .:: ::..:: CCDS22 YDGSVVAINPESDQPDLSNFMESGEWVIKESRGWKHSVTYSCCPDTPYLDITYHFVMQRL 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 PLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEIIPSSSKV ::.. . .::::. .:::: ::::::.. :::. : :::.::::::::: :.:::.:.. CCDS22 PLYFIVNVIIPCLLFSFLTGLVFYLPTDSGEKMTLSISVLLSLTVFLLVIVELIPSTSSA 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 IPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKLLCM--- .::::.:..:::.:: ::..::..:: :::: ::: .: :::.:. :.:... . CCDS22 VPLIGKYMLFTMVFVIASIIITVIVINTHHRSPSTH-VMPNWVRKVFIDTIPNIMFFSTM 300 310 320 330 340 370 380 390 400 410 pF1KE4 ----RSHVDR-YFTQKEETESGSG-----------PKSSRNTLEAALDSIRYITRHIMKE : . :. ::. . . :: : .. ...:...:.::.. . .. CCDS22 KRPSREKQDKKIFTEDIDISDISGKPGPPPMGFHSPLIKHPEVKSAIEGIKYIAETMKSD 350 360 370 380 390 400 420 430 440 450 460 pF1KE4 NDVREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK .. ... .::..:.:.:...: .:..: :.:.:..: CCDS22 QESNNAAAEWKYVAMVMDHILLGVFMLVCIIGTLAVFAGRLIELNQQG 410 420 430 440 450 >>CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 (498 aa) initn: 1004 init1: 682 opt: 1151 Z-score: 1441.8 bits: 276.2 E(32554): 5.5e-74 Smith-Waterman score: 1291; 43.2% identity (69.8% similar) in 461 aa overlap (43-449:23-480) 20 30 40 50 60 70 pF1KE4 LLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQD--YERWVRPVEHLND .:. :..:. ::.. :. .::. .. CCDS10 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQ 10 20 30 40 50 80 90 100 110 120 130 pF1KE4 KIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSDSVWT :.::. :...::..:.:..:.::::::::::: : .: :: . : :....:.:. .: CCDS10 LISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWL 60 70 80 90 100 110 140 150 160 170 180 pF1KE4 PDIVLFDNADGRFE-GTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCSMKFG :::::..:::: .: .. :. ..: ::.: : ::: :::.: :.: .:::: :::..:: CCDS10 PDIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFR 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 SWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKG-NRTDSCCWYPYVTYSFVIKR ::::: ...:..: .. :: .:::.::. : . : : : :::.:.::: CCDS10 SWTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQDPS--YVDVTYDFIIKR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 LPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEIIPSSSK :::::. :::::. ..:..:::::::. :::. :: :::..:: :::.: .:.: .: CCDS10 KPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 VIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKLLCMR- .::::.::.:::..::.::...: ..:.:::: :::. ::: :.. ::: :: .: :. CCDS10 DVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHT-MAPWVKRCFLHKLPTFLFMKR 300 310 320 330 340 370 380 pF1KE4 ----SHVDRYF-------TQKEETESGSGP------------------------------ : : : :. : : ....: CCDS10 PGPDSSPARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAGSTPVAIP 350 360 370 380 390 400 390 400 410 420 430 pF1KE4 -----KSS---RNTLEAALDSIRYITRHIMKENDVREVVEDWKFIAQVLDRMFLWTFLFV .:: :. .. ::... .:..:. .... . ::::::..:.:.::.:::.:.:: CCDS10 RDFWLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLFLWVFMFV 410 420 430 440 450 460 440 450 460 pF1KE4 SIVGSLGLFVPVIYKWANILIPVHIGNANK ..:..:::.: CCDS10 CVLGTVGLFLPPLFQTHAASEGPYAAQRD 470 480 490 468 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:03:09 2016 done: Sun Nov 6 01:03:09 2016 Total Scan time: 3.050 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]