FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4451, 468 aa
1>>>pF1KE4451 468 - 468 aa - 468 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4078+/-0.000895; mu= 16.9031+/- 0.054
mean_var=63.4970+/-13.065, 0's: 0 Z-trim(105.0): 75 B-trim: 489 in 1/48
Lambda= 0.160952
statistics sampled from 8135 (8212) to 8135 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.616), E-opt: 0.2 (0.252), width: 16
Scan time: 3.050
The best scores are: opt bits E(32554)
CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 3131 735.9 2e-212
CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1809 429.0 5.1e-120
CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1406 335.5 1e-91
CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 1397 333.3 3.7e-91
CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1324 316.4 4.4e-86
CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1300 310.8 2.1e-84
CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1300 310.8 2.1e-84
CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 1247 298.5 1.1e-80
CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1207 289.2 6.2e-78
CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 1151 276.2 5.5e-74
CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1138 273.2 4.3e-73
CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 1115 267.8 1.8e-71
CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 1032 248.6 1.1e-65
CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 1024 246.5 1.5e-65
CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 946 228.6 1.2e-59
CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 944 228.1 1.7e-59
CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 936 226.3 5.6e-59
CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 899 217.7 2.1e-56
CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 701 171.7 1.5e-42
CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 698 171.0 2.4e-42
CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 644 158.4 1.3e-38
CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 621 153.1 6.3e-37
CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 620 152.9 6.4e-37
CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 538 133.9 4e-31
CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 522 130.1 4.7e-30
CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 522 130.1 4.8e-30
CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 504 126.0 9.2e-29
CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 486 121.8 1.6e-27
CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 484 121.3 2.1e-27
CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 444 112.0 1.5e-24
CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 441 111.3 2.3e-24
CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 433 109.4 7.6e-24
CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 433 109.5 7.8e-24
CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 428 108.2 1.3e-23
CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 362 93.0 7.5e-19
CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 321 83.3 2.9e-16
CCDS10018.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 291 76.5 6.8e-14
CCDS4375.1 GABRP gene_id:2568|Hs108|chr5 ( 440) 288 75.8 1e-13
CCDS4354.1 GABRB2 gene_id:2561|Hs108|chr5 ( 474) 274 72.5 1.1e-12
CCDS4355.1 GABRB2 gene_id:2561|Hs108|chr5 ( 512) 274 72.6 1.1e-12
CCDS10019.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 273 72.3 1.2e-12
CCDS3796.1 GLRB gene_id:2743|Hs108|chr4 ( 497) 263 70.0 6.4e-12
CCDS54617.1 GABRR3 gene_id:200959|Hs108|chr3 ( 467) 262 69.8 7.2e-12
CCDS3474.1 GABRB1 gene_id:2560|Hs108|chr4 ( 474) 260 69.3 1e-11
CCDS3471.1 GABRA2 gene_id:2555|Hs108|chr4 ( 451) 259 69.0 1.1e-11
CCDS54942.1 GLRA1 gene_id:2741|Hs108|chr5 ( 457) 259 69.1 1.1e-11
CCDS43980.2 GLRA4 gene_id:441509|Hs108|chrX ( 417) 258 68.8 1.2e-11
CCDS82921.1 GABRA2 gene_id:2555|Hs108|chr4 ( 511) 259 69.1 1.3e-11
CCDS54813.1 GLRB gene_id:2743|Hs108|chr4 ( 303) 249 66.7 4e-11
CCDS45194.1 GABRA5 gene_id:2558|Hs108|chr15 ( 462) 251 67.2 4.2e-11
>>CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 (468 aa)
initn: 3131 init1: 3131 opt: 3131 Z-score: 3927.0 bits: 735.9 E(32554): 2e-212
Smith-Waterman score: 3131; 100.0% identity (100.0% similar) in 468 aa overlap (1-468:1-468)
10 20 30 40 50 60
pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 IRVPSDSVWTPDIVLFDNADGRFEGTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IRVPSDSVWTPDIVLFDNADGRFEGTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 LQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCWYPYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCWYPYV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 TYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 EIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 PKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKENDVREVVEDW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKENDVREVVEDW
370 380 390 400 410 420
430 440 450 460
pF1KE4 KFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK
430 440 450 460
>>CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 (458 aa)
initn: 2051 init1: 1221 opt: 1809 Z-score: 2268.1 bits: 429.0 E(32554): 5.1e-120
Smith-Waterman score: 2029; 67.6% identity (84.7% similar) in 444 aa overlap (28-454:13-453)
10 20 30 40 50 60
pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER
: ..: :. .:::..::.::. ::: :..
CCDS61 MLPDFMLVLIVLGIPSSATTGF---NSIAENEDALLRHLFQGYQK
10 20 30 40
70 80 90 100 110 120
pF1KE4 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV
::::: : :: ::. ::: :::::::::::::::::::::::: : ::::::::::::.
CCDS61 WVRPVLHSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHS
50 60 70 80 90 100
130 140 150 160 170
pF1KE4 IRVPSDSVWTPDIVLFDNADGRFEGT-STKTVIRYNGTVTWTPPANYKSSCTIDVTFFPF
:.:::.:.: ::::::.::::::::. ::.... ::::.:::::.::::::.:::::::
CCDS61 IKVPSESLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPF
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE4 DLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCWYPY
: ::::::::::::::..::.:: ...::..::::::::::..: : :::: :. ::.
CCDS61 DRQNCSMKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYSYPF
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE4 VTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVI
.:::::..::::::::::::::.::::::::::::::.::::. : ::::::::::::::
CCDS61 ITYSFVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVI
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE4 EEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHT
::::::::::::::::::.: ::::::::.::::.::.:::::::.. ::: :...::.
CCDS61 EEIIPSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQK
290 300 310 320 330 340
360 370 380 390 400
pF1KE4 LPKLLCMRSHVDRYFT-QKEETES---------------GSGPKSSRNTLEAALDSIRYI
:::::::..::::: . .:::.. ..: : :: : ::::::
CCDS61 LPKLLCMKDHVDRYSSPEKEESQPVVKGKVLEKKKQKQLSDGEKVLVAFLEKAADSIRYI
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE4 TRHIMKENDVREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHI
.::. ::. . .::.::::.::::::.::: ::.::..::. .:.:.. :
CCDS61 SRHVKKEHFISQVVQDWKFVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH
410 420 430 440 450
pF1KE4 GNANK
>>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa)
initn: 1495 init1: 531 opt: 1406 Z-score: 1760.3 bits: 335.5 E(32554): 1e-91
Smith-Waterman score: 1406; 58.2% identity (78.0% similar) in 364 aa overlap (7-367:5-359)
10 20 30 40 50 60
pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYER
:: : ::: . :. : : :. :. . :. :. ::: ::. :..
CCDS13 MELGGPGAPRLLPPLLLLLGT--------GLLRASSHVETRAHAEERLLKKLFSGYNK
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 WVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKV
: ::: ...: . ..:::.:.::.:::::::.::::::.:::: : ::::.: :: ..
CCDS13 WSRPVANISDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTS
60 70 80 90 100 110
130 140 150 160 170
pF1KE4 IRVPSDSVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPF
::.::. .: :::::..:::: : : ::. . ..: : ::::: :::::.::::::::
CCDS13 IRIPSELIWRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE4 DLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--Y
: :::.::::::::: ...:.. . ::. ::...::: ::.:.:. ..: :: :
CCDS13 DQQNCTMKFGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIY
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE4 PYVTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLL
: .::.:::.:::::::. :::::. .: ::::::::::. :::: :: :::.:::::::
CCDS13 PDITYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 VIEEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFL
.: :::::.: :::::::::.::::::::::..:::..:.:::: ::. : ::..::
CCDS13 LITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHT-MPTWVRRVFL
300 310 320 330 340
360 370 380 390 400 410
pF1KE4 HTLPKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKENDVREVV
.:.:: :.
CCDS13 DIVPRLLLMKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFC
350 360 370 380 390 400
>>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa)
initn: 1554 init1: 540 opt: 1397 Z-score: 1750.1 bits: 333.3 E(32554): 3.7e-91
Smith-Waterman score: 1464; 51.1% identity (70.7% similar) in 468 aa overlap (37-442:49-515)
10 20 30 40 50 60
pF1KE4 GPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVE
: . .: .. :: :.: ::. :.::.:::
CCDS60 LLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARPVP
20 30 40 50 60 70
70 80 90 100 110 120
pF1KE4 HLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSD
. .: . ..:::.:.::.:::::::.::::::::::: : :::::: :.:.: .::::.
CCDS60 NTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSE
80 90 100 110 120 130
130 140 150 160 170 180
pF1KE4 SVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCS
.: :::::..::::.: : ::. . .::: :.::: :::::.::::::::: :::.
CCDS60 MIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCK
140 150 160 170 180 190
190 200 210 220 230 240
pF1KE4 MKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYS
::::::::: ...:. .: :: .:....::: ::.:::. ... .:: :: :::.
CCDS60 MKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYA
200 210 220 230 240 250
250 260 270 280 290 300
pF1KE4 FVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEII
:::.:::::::. :::::. .: ::::::::::. :::: :: :::.:::::::.: :::
CCDS60 FVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEII
260 270 280 290 300 310
310 320 330 340 350 360
pF1KE4 PSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKL
::.: :::::::::.::::::::::..:::..:.:::: :::. : :: .: .:.
CCDS60 PSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHT-MPHWVRGALLGCVPRW
320 330 340 350 360 370
370 380
pF1KE4 L-----------C-------------MRSHVD---RYFTQKEETE---------------
: : ..:.:: : . .:: .
CCDS60 LLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLC
380 390 400 410 420 430
390 400 410 420
pF1KE4 ------SG-SGPKSS----------RNTLEAALDSIRYITRHIMKENDVREVVEDWKFIA
:: ::::. .. ::....::. :. .:. : ::::..:
CCDS60 SHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVA
440 450 460 470 480 490
430 440 450 460
pF1KE4 QVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK
.:.::.::: :..: ..:
CCDS60 MVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
500 510 520
>>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa)
initn: 1440 init1: 517 opt: 1324 Z-score: 1659.0 bits: 316.4 E(32554): 4.4e-86
Smith-Waterman score: 1411; 47.3% identity (73.1% similar) in 457 aa overlap (47-451:34-488)
20 30 40 50 60 70
pF1KE4 VQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVEHLNDKIKIKF
:. :.. ::. :....::::...: . ..:
CCDS61 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF
10 20 30 40 50 60
80 90 100 110 120 130
pF1KE4 GLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSDSVWTPDIVLF
.::.::..::: ::.: ::.::.. : : ::::.: .: ::...:::.:..: :::::.
CCDS61 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE4 DNADGRF--EGTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCSMKFGSWTYD
.:: : : :: .::....::: .:::::: .:::: .:.:::::: ::::.::::::::
CCDS61 NNAVGDFQVEG-KTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYD
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE4 GSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYSFVIKRLPLF
...:... . :: ::..:.::::..:.: : . .:: : .:::: :.:::.:
CCDS61 KAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMF
190 200 210 220 230 240
260 270 280 290 300 310
pF1KE4 YTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEIIPSSSKVIPL
::. :::::. .::::::::::::. :::. :: :::.::::::::: : :::.: :.::
CCDS61 YTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPL
250 260 270 280 290 300
320 330 340 350 360 370
pF1KE4 IGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKLLCMRSHVDR
.::::.::::::::::.::::..:::.:. .::. : :. .::. ::..: :: .:.
CCDS61 VGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHT-MPRWVKTVFLKLLPQVLLMRWPLDK
310 320 330 340 350 360
380 390
pF1KE4 --------------YFTQKEETESGSGPK---------------SSRNTL----------
: . : . :. .:. :
CCDS61 TRGTGSDAVPRGLARRPAKGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVVE
370 380 390 400 410 420
400 410 420 430 440
pF1KE4 --------EAALDSIRYITRHIMKENDVREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLG
: ...:...:.... ..:...:: .:::..:.:.::.:::.:..: . :. :
CCDS61 NSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCVFGTAG
430 440 450 460 470 480
450 460
pF1KE4 LFV-PVIYKWANILIPVHIGNANK
::. :..
CCDS61 LFLQPLLGNTGKS
490
>>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa)
initn: 1332 init1: 523 opt: 1300 Z-score: 1628.9 bits: 310.8 E(32554): 2.1e-84
Smith-Waterman score: 1301; 53.6% identity (77.2% similar) in 364 aa overlap (6-366:13-356)
10 20 30 40 50
pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKD
: :: : :::: : ..: .: :.:. :..
CCDS53 MGSGPLSLPLALSPPRLLLLLLLSLLPVAR-----------------ASEAEHR--LFER
10 20 30 40
60 70 80 90 100 110
pF1KE4 LFQDYERWVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPD
::.::.. .::: ...: . :.: ...:::: ::: ::.: ::.:::: : : ::.:::.
CCDS53 LFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPS
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE4 DYGGIKVIRVPSDSVWTPDIVLFDNADGRFE-GTSTKTVIRYNGTVTWTPPANYKSSCTI
:::: . .:::....: :::::..:: : :. .::....:.: ::: ::: .:::: :
CCDS53 DYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKI
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE4 DVTFFPFDLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTD
:::.:::: :::.::::::.:: ...:..: .... .:....::: :..: : : .
CCDS53 DVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKY
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE4 SCCW--YPYVTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLV
.:: :: .:::. :.:::::::. :::::. .::::::::::::. :::. :: :::.
CCDS53 NCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLL
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE4 SLTVFLLVIEEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAP
::::::::: : :::.: :::::::::.::::::::::..:::..:.:.:. .::. :
CCDS53 SLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHT-MPS
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE4 LVRKIFLHTLPKLLCMRSHVDRYFTQKEETESGSGPKSSRNTLEAALDSIRYITRHIMKE
:. .::. ::... :
CCDS53 WVKTVFLNLLPRVMFMTRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDG
350 360 370 380 390 400
>>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa)
initn: 1470 init1: 523 opt: 1300 Z-score: 1628.7 bits: 310.8 E(32554): 2.1e-84
Smith-Waterman score: 1363; 44.9% identity (68.5% similar) in 499 aa overlap (6-443:13-491)
10 20 30 40 50
pF1KE4 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKD
: :: : :::: : ..: .: :.:. :..
CCDS10 MGSGPLSLPLALSPPRLLLLLLLSLLPVAR-----------------ASEAEHR--LFER
10 20 30 40
60 70 80 90 100 110
pF1KE4 LFQDYERWVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPD
::.::.. .::: ...: . :.: ...:::: ::: ::.: ::.:::: : : ::.:::.
CCDS10 LFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPS
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE4 DYGGIKVIRVPSDSVWTPDIVLFDNADGRFE-GTSTKTVIRYNGTVTWTPPANYKSSCTI
:::: . .:::....: :::::..:: : :. .::....:.: ::: ::: .:::: :
CCDS10 DYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKI
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE4 DVTFFPFDLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTD
:::.:::: :::.::::::.:: ...:..: .... .:....::: :..: : : .
CCDS10 DVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKY
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE4 SCCW--YPYVTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLV
.:: :: .:::. :.:::::::. :::::. .::::::::::::. :::. :: :::.
CCDS10 NCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLL
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE4 SLTVFLLVIEEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAP
::::::::: : :::.: :::::::::.::::::::::..:::..:.:.:. .::. :
CCDS10 SLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHT-MPS
290 300 310 320 330 340
360 370 380
pF1KE4 LVRKIFLHTLPKLLCM-RSHVDRYFTQKEETESGS--------------GPK--------
:. .::. ::... : : .. .:: . :. : :
CCDS10 WVKTVFLNLLPRVMFMTRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDG
350 360 370 380 390 400
390 400 410
pF1KE4 ----------------------SSRNTLEA-------------ALDSIRYITRHIMKEND
:: ....: :..:..::.... .:.
CCDS10 MCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNE
410 420 430 440 450 460
420 430 440 450 460
pF1KE4 VREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK
..:. .:::..:.:.::.:::.: .: :.:.
CCDS10 AKEIQDDWKYVAMVIDRIFLWVFTLVCILGTAGLFLQPLMAREDA
470 480 490 500
>>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa)
initn: 1408 init1: 540 opt: 1247 Z-score: 1562.1 bits: 298.5 E(32554): 1.1e-80
Smith-Waterman score: 1367; 49.6% identity (67.9% similar) in 468 aa overlap (37-442:49-500)
10 20 30 40 50 60
pF1KE4 GPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVE
: . .: .. :: :.: ::. :.::.:::
CCDS64 LLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARPVP
20 30 40 50 60 70
70 80 90 100 110 120
pF1KE4 HLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSD
. .: ::::::.::::::::::: : :::::: :.:.: .::::.
CCDS64 NTSD---------------VDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSE
80 90 100 110 120
130 140 150 160 170 180
pF1KE4 SVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCS
.: :::::..::::.: : ::. . .::: :.::: :::::.::::::::: :::.
CCDS64 MIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 MKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYS
::::::::: ...:. .: :: .:....::: ::.:::. ... .:: :: :::.
CCDS64 MKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 FVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEII
:::.:::::::. :::::. .: ::::::::::. :::: :: :::.:::::::.: :::
CCDS64 FVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEII
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 PSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKL
::.: :::::::::.::::::::::..:::..:.:::: :::. : :: .: .:.
CCDS64 PSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHT-MPHWVRGALLGCVPRW
310 320 330 340 350 360
370 380
pF1KE4 L-----------C-------------MRSHVD---RYFTQKEETE---------------
: : ..:.:: : . .:: .
CCDS64 LLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLC
370 380 390 400 410 420
390 400 410 420
pF1KE4 ------SG-SGPKSS----------RNTLEAALDSIRYITRHIMKENDVREVVEDWKFIA
:: ::::. .. ::....::. :. .:. : ::::..:
CCDS64 SHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVA
430 440 450 460 470 480
430 440 450 460
pF1KE4 QVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK
.:.::.::: :..: ..:
CCDS64 MVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
490 500 510
>>CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 (457 aa)
initn: 1263 init1: 447 opt: 1207 Z-score: 1512.7 bits: 289.2 E(32554): 6.2e-78
Smith-Waterman score: 1300; 46.6% identity (74.5% similar) in 427 aa overlap (44-447:21-446)
20 30 40 50 60 70
pF1KE4 LLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVEHLNDKIK
..:: :. ::.:: ::::: . ..
CCDS22 MEPWPLLLLFSLCSAGLVLGSEHETRLVAKLFKDYSSVVRPVEDHRQVVE
10 20 30 40 50
80 90 100 110 120 130
pF1KE4 IKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSDSVWTPDI
. :: . ::..::: ::..:::: :::.:.: .:.::::::::.: :..::...: ::.
CCDS22 VTVGLQLIQLINVDEVNQIVTTNVRLKQQWVDYNLKWNPDDYGGVKKIHIPSEKIWRPDL
60 70 80 90 100 110
140 150 160 170 180 190
pF1KE4 VLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCSMKFGSWT
::..:::: : .. ::....:.: .:::::: .:: : : :: :::: ::::::.:.::
CCDS22 VLYNNADGDFAIVKFTKVLLQYTGHITWTPPAIFKSYCEIIVTHFPFDEQNCSMKLGTWT
120 130 140 150 160 170
200 210 220 230 240
pF1KE4 YDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW-YPY--VTYSFVIKRL
:::: : : :... : .:...::: : . : : . : ::: :: .:: ::..::
CCDS22 YDGSVVAINPESDQPDLSNFMESGEWVIKESRGWKHSVTYSCCPDTPYLDITYHFVMQRL
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 PLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEIIPSSSKV
::.. . .::::. .:::: ::::::.. :::. : :::.::::::::: :.:::.:..
CCDS22 PLYFIVNVIIPCLLFSFLTGLVFYLPTDSGEKMTLSISVLLSLTVFLLVIVELIPSTSSA
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 IPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKLLCM---
.::::.:..:::.:: ::..::..:: :::: ::: .: :::.:. :.:... .
CCDS22 VPLIGKYMLFTMVFVIASIIITVIVINTHHRSPSTH-VMPNWVRKVFIDTIPNIMFFSTM
300 310 320 330 340
370 380 390 400 410
pF1KE4 ----RSHVDR-YFTQKEETESGSG-----------PKSSRNTLEAALDSIRYITRHIMKE
: . :. ::. . . :: : .. ...:...:.::.. . ..
CCDS22 KRPSREKQDKKIFTEDIDISDISGKPGPPPMGFHSPLIKHPEVKSAIEGIKYIAETMKSD
350 360 370 380 390 400
420 430 440 450 460
pF1KE4 NDVREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK
.. ... .::..:.:.:...: .:..: :.:.:..:
CCDS22 QESNNAAAEWKYVAMVMDHILLGVFMLVCIIGTLAVFAGRLIELNQQG
410 420 430 440 450
>>CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 (498 aa)
initn: 1004 init1: 682 opt: 1151 Z-score: 1441.8 bits: 276.2 E(32554): 5.5e-74
Smith-Waterman score: 1291; 43.2% identity (69.8% similar) in 461 aa overlap (43-449:23-480)
20 30 40 50 60 70
pF1KE4 LLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQD--YERWVRPVEHLND
.:. :..:. ::.. :. .::. ..
CCDS10 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQ
10 20 30 40 50
80 90 100 110 120 130
pF1KE4 KIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSDSVWT
:.::. :...::..:.:..:.::::::::::: : .: :: . : :....:.:. .:
CCDS10 LISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWL
60 70 80 90 100 110
140 150 160 170 180
pF1KE4 PDIVLFDNADGRFE-GTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCSMKFG
:::::..:::: .: .. :. ..: ::.: : ::: :::.: :.: .:::: :::..::
CCDS10 PDIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFR
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 SWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKG-NRTDSCCWYPYVTYSFVIKR
::::: ...:..: .. :: .:::.::. : . : : : :::.:.:::
CCDS10 SWTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQDPS--YVDVTYDFIIKR
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 LPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEIIPSSSK
:::::. :::::. ..:..:::::::. :::. :: :::..:: :::.: .:.: .:
CCDS10 KPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 VIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKLLCMR-
.::::.::.:::..::.::...: ..:.:::: :::. ::: :.. ::: :: .: :.
CCDS10 DVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHT-MAPWVKRCFLHKLPTFLFMKR
300 310 320 330 340
370 380
pF1KE4 ----SHVDRYF-------TQKEETESGSGP------------------------------
: : : :. : : ....:
CCDS10 PGPDSSPARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAGSTPVAIP
350 360 370 380 390 400
390 400 410 420 430
pF1KE4 -----KSS---RNTLEAALDSIRYITRHIMKENDVREVVEDWKFIAQVLDRMFLWTFLFV
.:: :. .. ::... .:..:. .... . ::::::..:.:.::.:::.:.::
CCDS10 RDFWLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLFLWVFMFV
410 420 430 440 450 460
440 450 460
pF1KE4 SIVGSLGLFVPVIYKWANILIPVHIGNANK
..:..:::.:
CCDS10 CVLGTVGLFLPPLFQTHAASEGPYAAQRD
470 480 490
468 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 01:03:09 2016 done: Sun Nov 6 01:03:09 2016
Total Scan time: 3.050 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]