FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2452, 529 aa
1>>>pF1KE2452 529 - 529 aa - 529 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3901+/-0.000719; mu= 14.2345+/- 0.044
mean_var=92.0486+/-18.378, 0's: 0 Z-trim(112.0): 78 B-trim: 0 in 0/52
Lambda= 0.133680
statistics sampled from 12774 (12854) to 12774 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.737), E-opt: 0.2 (0.395), width: 16
Scan time: 2.280
The best scores are: opt bits E(32554)
CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 3658 715.3 4.4e-206
CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 2986 585.7 4.4e-167
CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1919 379.9 4.6e-105
CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1841 364.8 1.3e-100
CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1639 325.9 6.7e-89
CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1522 303.3 4.2e-82
CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1423 284.2 2.2e-76
CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 1397 279.2 7.3e-75
CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1318 264.0 2.9e-70
CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 1314 263.2 5.1e-70
CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 1285 257.6 2.6e-68
CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1281 256.8 3.9e-68
CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 1281 256.8 4.2e-68
CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 1232 247.4 2.9e-65
CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 1113 224.4 2.3e-58
CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 989 200.5 3.4e-51
CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 971 197.0 4e-50
CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 903 183.9 3.1e-46
CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 715 147.7 2.9e-35
CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 710 146.7 5.5e-35
CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 682 141.2 1.7e-33
CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 649 134.9 2.1e-31
CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 628 130.9 3.5e-30
CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 619 129.2 1.2e-29
CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 588 123.2 7.2e-28
CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 572 120.1 6.2e-27
CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 567 119.1 1.1e-26
CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 567 119.1 1.1e-26
CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 566 118.9 1.2e-26
CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 539 113.7 4.5e-25
CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 536 113.2 7.4e-25
CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 480 102.1 5e-22
CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 486 103.5 5.3e-22
CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 486 103.5 5.5e-22
CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 406 88.1 2.5e-17
CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 333 73.8 2.3e-13
CCDS4358.1 GABRG2 gene_id:2566|Hs108|chr5 ( 467) 335 74.4 3.3e-13
CCDS4359.1 GABRG2 gene_id:2566|Hs108|chr5 ( 475) 335 74.4 3.3e-13
CCDS3470.1 GABRG1 gene_id:2565|Hs108|chr4 ( 465) 317 70.9 3.6e-12
CCDS4375.1 GABRP gene_id:2568|Hs108|chr5 ( 440) 313 70.1 5.9e-12
CCDS3474.1 GABRB1 gene_id:2560|Hs108|chr4 ( 474) 309 69.4 1.1e-11
CCDS10018.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 297 67.0 5.3e-11
CCDS4354.1 GABRB2 gene_id:2561|Hs108|chr5 ( 474) 296 66.9 6.1e-11
CCDS4355.1 GABRB2 gene_id:2561|Hs108|chr5 ( 512) 296 66.9 6.5e-11
CCDS3796.1 GLRB gene_id:2743|Hs108|chr4 ( 497) 295 66.7 7.3e-11
CCDS10019.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 293 66.3 9.1e-11
>>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa)
initn: 3658 init1: 3658 opt: 3658 Z-score: 3813.4 bits: 715.3 E(32554): 4.4e-206
Smith-Waterman score: 3658; 100.0% identity (100.0% similar) in 529 aa overlap (1-529:1-529)
10 20 30 40 50 60
pF1KE2 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETED
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 RLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 RWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 RWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 SSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 SSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 NSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 NSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 ISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 ISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 TMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 TMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 DRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 DRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHL
430 440 450 460 470 480
490 500 510 520
pF1KE2 RSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 RSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
490 500 510 520
>>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa)
initn: 2983 init1: 2983 opt: 2986 Z-score: 3113.1 bits: 585.7 E(32554): 4.4e-167
Smith-Waterman score: 3530; 97.2% identity (97.2% similar) in 529 aa overlap (1-529:1-514)
10 20 30 40 50 60
pF1KE2 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETED
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKL
::::::::::::::::::::::: ::::::::::::::::::::::
CCDS64 RLFKHLFRGYNRWARPVPNTSDV---------------DEKNQMMTTNVWLKQEWSDYKL
70 80 90 100
130 140 150 160 170 180
pF1KE2 RWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 RWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYK
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE2 SSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 SSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTY
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE2 NSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 NSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLC
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE2 ISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 ISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTH
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE2 TMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 TMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEE
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE2 DRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 DRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHL
410 420 430 440 450 460
490 500 510 520
pF1KE2 RSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 RSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
470 480 490 500 510
>>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa)
initn: 2271 init1: 1898 opt: 1919 Z-score: 1999.7 bits: 379.9 E(32554): 4.6e-105
Smith-Waterman score: 1919; 75.1% identity (86.3% similar) in 386 aa overlap (25-406:4-380)
10 20 30 40 50
pF1KE2 MGPSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTET--
:: : : : :: :.: ...::.::
CCDS13 MELGGPGAPRLLP-----PLLLLLGTGLLRASSHVETRA
10 20 30
60 70 80 90 100 110
pF1KE2 --EDRLFKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWS
:.::.:.:: :::.:.::: : ::::.:::::::::::::::::::::::::.::::
CCDS13 HAEERLLKKLFSGYNKWSRPVANISDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWH
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE2 DYKLRWNPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPP
::::::.:.:. :.::.:.:::.:: :::::::::::.:::::.:::::: : :.:.::
CCDS13 DYKLRWDPADYENVTSIRIPSELIWRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPP
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE2 AIYKSSCSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNA
::::::::::::::::::::: ::::::::::::::: .:.. :: :.::::::.::.:
CCDS13 AIYKSSCSIDVTFFPFDQQNCTMKFGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDA
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE2 TGTYNSKKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEK
.::::..::.::::::::.::::::::::::::::::::::::::::::::::::.::::
CCDS13 VGTYNTRKYECCAEIYPDITYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEK
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE2 ITLCISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ITLCISVLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRS
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE2 PSTHTMPHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVV
: ::::: ::: ..: ::: :::.:: . :. .: :.: . :
CCDS13 PRTHTMPTWVRRVFLDIVPRLLLMKRPSVVKDNCR----RLIESMHKMASAPRFWPEPEG
340 350 360 370 380 390
420 430 440 450 460 470
pF1KE2 VEEEDRWACAGHVAPSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYI
CCDS13 EPPATSGTQSLHPPSPSFCVPLDVPAEPGPSCKSPSDQLPPQQPLEAEKASPHPSPGPCR
400 410 420 430 440 450
>--
initn: 480 init1: 387 opt: 387 Z-score: 402.9 bits: 84.5 E(32554): 4e-16
Smith-Waterman score: 387; 78.6% identity (94.3% similar) in 70 aa overlap (460-529:558-627)
430 440 450 460 470 480
pF1KE2 APSVGTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSV
: ::: . .:.:::.::::::..::.: ::
CCDS13 PCKCTCKKEPSSVSPSATVKTRSTKAPPPHLPLSPALTRAVEGVQYIADHLKAEDTDFSV
530 540 550 560 570 580
490 500 510 520
pF1KE2 KEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
:::::::::::::::::.:::::.:::.::::::.:::::
CCDS13 KEDWKYVAMVIDRIFLWMFIIVCLLGTVGLFLPPWLAGMI
590 600 610 620
>>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa)
initn: 1864 init1: 1602 opt: 1841 Z-score: 1919.8 bits: 364.8 E(32554): 1.3e-100
Smith-Waterman score: 1842; 56.7% identity (76.1% similar) in 506 aa overlap (33-526:14-501)
10 20 30 40 50 60
pF1KE2 PSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRL
::: : : :.: .:.: ::
CCDS10 MGSGPLSLPLALSPPRLLLLLLLSLLPVA-----RASEAEHRL
10 20 30
70 80 90 100 110 120
pF1KE2 FKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRW
:..::. ::. ::: :.:: ::..: .:..::. ::: ::.: ::.:::: :.::::.:
CCDS10 FERLFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKW
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE2 NPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSS
::.:.:. .:::.. :: ::::::::: :.: : ::: : :: : :.::::.:::
CCDS10 NPSDYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSS
100 110 120 130 140 150
190 200 210 220 230 240
pF1KE2 CSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNS
:.::::.:::: ::: ::::::.:::::::: . ....::::::::::::..: : ..
CCDS10 CKIDVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHD
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE2 KKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCIS
::.:: :::::.::.. :::::::::::::::::::: :::::::::::::::.:::::
CCDS10 IKYNCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCIS
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE2 VLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTM
::::::::::.::: ::::::::::::::::::::::::::::::::::::.:.:.::::
CCDS10 VLLSLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTM
280 290 300 310 320 330
370 380 390 400 410 420
pF1KE2 PHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDR
: ::. ..:. .:: ..:.:: . : : : ::.. : :..
CCDS10 PSWVKTVFLNLLPRVMFMTRPTSNEGNAQKPR----PLYGAELSNLNCFSRA-----ESK
340 350 360 370 380
430 440 450 460 470
pF1KE2 WACAGHVAPSVGTLCSHGH------------LHSGASGPKAEALLQEGELLLSPHMQKAL
:. : .:.. : : ..:. ...:.:. . : ::....:.
CCDS10 GCKEGY--PCQDGMCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSAL--SPEIKEAI
390 400 410 420 430 440
480 490 500 510 520
pF1KE2 EGVHYIADHLRSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
..:.:::....... . ...:::::::::::::::.: .::.::: :::: :..:
CCDS10 QSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIFLWVFTLVCILGTAGLFLQPLMAREDA
450 460 470 480 490 500
>>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa)
initn: 1659 init1: 1602 opt: 1639 Z-score: 1709.5 bits: 325.9 E(32554): 6.7e-89
Smith-Waterman score: 1640; 55.7% identity (74.7% similar) in 474 aa overlap (33-494:14-466)
10 20 30 40 50 60
pF1KE2 PSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRL
::: : : :.: .:.: ::
CCDS53 MGSGPLSLPLALSPPRLLLLLLLSLLPVA-----RASEAEHRL
10 20 30
70 80 90 100 110 120
pF1KE2 FKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRW
:..::. ::. ::: :.:: ::..: .:..::. ::: ::.: ::.:::: :.::::.:
CCDS53 FERLFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKW
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE2 NPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSS
::.:.:. .:::.. :: ::::::::: :.: : ::: : :: : :.::::.:::
CCDS53 NPSDYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSS
100 110 120 130 140 150
190 200 210 220 230 240
pF1KE2 CSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNS
:.::::.:::: ::: ::::::.:::::::: . ....::::::::::::..: : ..
CCDS53 CKIDVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHD
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE2 KKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCIS
::.:: :::::.::.. :::::::::::::::::::: :::::::::::::::.:::::
CCDS53 IKYNCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCIS
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE2 VLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTM
::::::::::.::: ::::::::::::::::::::::::::::::::::::.:.:.::::
CCDS53 VLLSLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTM
280 290 300 310 320 330
370 380 390 400 410 420
pF1KE2 PHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDR
: ::. ..:. .:: ..:.:: . : : : ::.. : :..
CCDS53 PSWVKTVFLNLLPRVMFMTRPTSNEGNAQKPR----PLYGAELSNLNCFSRA-----ESK
340 350 360 370 380
430 440 450 460 470
pF1KE2 WACAGHVAPSVGTLCSHGH------------LHSGASGPKAEALLQEGELLLSPHMQKAL
:. : .:.. : : ..:. ...:.:. . :::....:.
CCDS53 GCKEGY--PCQDGMCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSA--LSPEIKEAI
390 400 410 420 430 440
480 490 500 510 520
pF1KE2 EGVHYIADHLRSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
..:.:::.... :.. .::. :
CCDS53 QSVKYIAENMK---AQNEAKEEQKAQEIQQLKRKEKSTETSDQEPGL
450 460 470 480
>>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa)
initn: 1766 init1: 1520 opt: 1522 Z-score: 1587.5 bits: 303.3 E(32554): 4.2e-82
Smith-Waterman score: 1733; 53.9% identity (76.0% similar) in 484 aa overlap (47-525:22-488)
20 30 40 50 60 70
pF1KE2 WWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARP
: . .: ::.:::..:: ::.. ::
CCDS61 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRP
10 20 30 40 50
80 90 100 110 120 130
pF1KE2 VPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVP
: :.:: : :.: ..:.:: .::: ::.: ::.::.. :.::::::.: .. .: .::::
CCDS61 VENVSDPVTVHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVP
60 70 80 90 100 110
140 150 160 170 180 190
pF1KE2 SEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQN
.. :: ::::::::: :.: : ::: : .: . :.::::.:::: .:.::::::.::
CCDS61 ADKIWKPDIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQN
120 130 140 150 160 170
200 210 220 230 240 250
pF1KE2 CKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVT
:..::::::::::.::: . . ::..:.::..:: :..:.: .. ::.:: ::: :.:
CCDS61 CSLKFGSWTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDIT
180 190 200 210 220 230
260 270 280 290 300 310
pF1KE2 YAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITE
:.: :::::.:::::::::::.:: :::::::::::::::.:::::::::::::::.:::
CCDS61 YSFYIRRLPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITE
240 250 260 270 280 290
320 330 340 350 360 370
pF1KE2 IIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPR
:::::::.::.::::::::::::::::.::::::.:.:.:.:::::.::. ..: .:.
CCDS61 TIPSTSLVVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQ
300 310 320 330 340 350
380 390 400 410 420 430
pF1KE2 WLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTL
::: : :. . .. :: : .. .. . :.: :
CCDS61 VLLMRWP-------------LDKTRG---TGSDAVPRGLA-RRPAKGKLASHGEPRHLKE
360 370 380 390
440 450 460 470 480 490
pF1KE2 CSHGHLHSGASGPKAEALLQEGELLL-----SPHMQKALEGVHYIADHLRSEDADSSVKE
: : : . . : . : . .. ::... ....:..::....:.. . :..
CCDS61 CFHCHKSNELATSKRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVED
400 410 420 430 440 450
500 510 520
pF1KE2 DWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
::::::::.::.:::.::::: .:: :::: :.:
CCDS61 DWKYVAMVVDRVFLWVFIIVCVFGTAGLFLQPLLGNTGKS
460 470 480 490
>>CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 (458 aa)
initn: 1579 init1: 860 opt: 1423 Z-score: 1484.8 bits: 284.2 E(32554): 2.2e-76
Smith-Waterman score: 1567; 52.4% identity (73.9% similar) in 479 aa overlap (46-522:15-448)
20 30 40 50 60 70
pF1KE2 LWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQG-GSHTETEDRLFKHLFRGYNRWA
:.. : .: .:.:: :..:::.::..:.
CCDS61 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQGYQKWV
10 20 30 40
80 90 100 110 120 130
pF1KE2 RPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLR
::: ...:.. : :::.:.::.:::::::.:::::::::::.:.:::::: :.:.: :..
CCDS61 RPVLHSNDTIKVYFGLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIK
50 60 70 80 90 100
140 150 160 170 180 190
pF1KE2 VPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQ
:::: .:.:::::..::::.: . :::. . :.::: :.::: :::::..::::::::.
CCDS61 VPSESLWLPDIVLFENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDR
110 120 130 140 150 160
200 210 220 230 240 250
pF1KE2 QNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPD
:::.::::::::: . .:: ....:: ::....::: :.:: : .... . ::
CCDS61 QNCSMKFGSWTYDGTMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYS--YPF
170 180 190 200 210 220
260 270 280 290 300 310
pF1KE2 VTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLI
.::.::.::::::::. :::::: .: ::::::::::: :::..: :::.:::::::.:
CCDS61 ITYSFVLRRLPLFYTLFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVI
230 240 250 260 270 280
320 330 340 350 360 370
pF1KE2 TEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPST-HTMPHWVRGALLGC
:::::.: ::::::::::: ::::::::..::::.:::::: :: : : ::. .:
CCDS61 EEIIPSSSKVIPLIGEYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQK
290 300 310 320 330 340
380 390 400 410 420 430
pF1KE2 VPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSV
.:. : :. : : . :: . :: . ::. :.: .
CCDS61 LPKLLCMKD--------HVDRYS-SP---------EKEESQPVVK--------GKVLEK-
350 360 370
440 450 460 470 480 490
pF1KE2 GTLCSHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDW
: . :..:: .: ..:: ....::. :...: :.: .::
CCDS61 ----------------KKQKQLSDGEKVLVAFLEKAADSIRYISRHVKKEHFISQVVQDW
380 390 400 410
500 510 520
pF1KE2 KYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
:.::.:.::::::::.:: :.. .: :
CCDS61 KFVAQVLDRIFLWLFLIVSVTGSVLIFTPALKMWLHSYH
420 430 440 450
>>CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 (468 aa)
initn: 1554 init1: 540 opt: 1397 Z-score: 1457.5 bits: 279.2 E(32554): 7.3e-75
Smith-Waterman score: 1500; 51.2% identity (71.2% similar) in 475 aa overlap (49-522:37-449)
20 30 40 50 60 70
pF1KE2 LLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARPVP
: . .: .. :: :.: ::. :.::.:::
CCDS10 GPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVE
10 20 30 40 50 60
80 90 100 110 120 130
pF1KE2 NTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSE
. .: . ..:::.:.::.:::::::.::::::::::: : :::::: :.:.: .::::.
CCDS10 HLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSD
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE2 MIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCK
.: :::::..::::.: : ::. . .::: :.::: :::::.::::::::: :::.
CCDS10 SVWTPDIVLFDNADGRFEGTS-TKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCS
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE2 MKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYA
::::::::: ...:. .: :: .:....::: ::.:::. ... .:: :: :::.
CCDS10 MKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYS
190 200 210 220 230 240
260 270 280 290 300 310
pF1KE2 FVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEII
:::.:::::::. :::::. .: ::::::::::. :::: :: :::.:::::::.: :::
CCDS10 FVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEII
250 260 270 280 290 300
320 330 340 350 360 370
pF1KE2 PSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHT-MPHWVRGALLGCVPRW
::.: :::::::::.::::::::::..:::..:.:::: :::. : :: .: .:.
CCDS10 PSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKL
310 320 330 340 350 360
380 390 400 410 420 430
pF1KE2 LLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLC
:: ..:.:: : . .:: .
CCDS10 -----------LC-------------MRSHVD---RYFTQKEETE---------------
370 380
440 450 460 470 480 490
pF1KE2 SHGHLHSGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVA
:: ::::. .. ::....::. :. .:. : ::::..:
CCDS10 ------SG-SGPKSS----------RNTLEAALDSIRYITRHIMKENDVREVVEDWKFIA
390 400 410 420
500 510 520
pF1KE2 MVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
.:.::.::: :..: ..:..:::.:
CCDS10 QVLDRMFLWTFLFVSIVGSLGLFVPVIYKWANILIPVHIGNANK
430 440 450 460
>>CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 (479 aa)
initn: 1686 init1: 1318 opt: 1318 Z-score: 1375.0 bits: 264.0 E(32554): 2.9e-70
Smith-Waterman score: 1623; 52.1% identity (73.3% similar) in 484 aa overlap (47-525:22-473)
20 30 40 50 60 70
pF1KE2 WWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARP
: . .: ::.:::..:: ::.. ::
CCDS56 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRP
10 20 30 40 50
80 90 100 110 120 130
pF1KE2 VPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVP
: :.:: : :.: ..:.:: .: :.::::::.: .. .: .::::
CCDS56 VENVSDPVTVHFEVAITQLANVI---------------WNDYKLRWDPMEYDGIETLRVP
60 70 80 90
140 150 160 170 180 190
pF1KE2 SEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQN
.. :: ::::::::: :.: : ::: : .: . :.::::.:::: .:.::::::.::
CCDS56 ADKIWKPDIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQN
100 110 120 130 140 150
200 210 220 230 240 250
pF1KE2 CKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVT
:..::::::::::.::: . . ::..:.::..:: :..:.: .. ::.:: ::: :.:
CCDS56 CSLKFGSWTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDIT
160 170 180 190 200 210
260 270 280 290 300 310
pF1KE2 YAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITE
:.: :::::.:::::::::::.:: :::::::::::::::.:::::::::::::::.:::
CCDS56 YSFYIRRLPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITE
220 230 240 250 260 270
320 330 340 350 360 370
pF1KE2 IIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPR
:::::::.::.::::::::::::::::.::::::.:.:.:.:::::.::. ..: .:.
CCDS56 TIPSTSLVVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQ
280 290 300 310 320 330
380 390 400 410 420 430
pF1KE2 WLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTL
::: : :. . .. :: : .. .. . :.: :
CCDS56 VLLMRWP-------------LDKTRG---TGSDAVPRGLA-RRPAKGKLASHGEPRHLKE
340 350 360 370
440 450 460 470 480 490
pF1KE2 CSHGHLHSGASGPKAEALLQEGELLL-----SPHMQKALEGVHYIADHLRSEDADSSVKE
: : : . . : . : . .. ::... ....:..::....:.. . :..
CCDS56 CFHCHKSNELATSKRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVED
380 390 400 410 420 430
500 510 520
pF1KE2 DWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
::::::::.::.:::.::::: .:: :::: :.:
CCDS56 DWKYVAMVVDRVFLWVFIIVCVFGTAGLFLQPLLGNTGKS
440 450 460 470
>>CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 (502 aa)
initn: 1587 init1: 679 opt: 1314 Z-score: 1370.6 bits: 263.2 E(32554): 5.1e-70
Smith-Waterman score: 1584; 51.7% identity (73.9% similar) in 472 aa overlap (56-525:26-483)
30 40 50 60 70 80
pF1KE2 GEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRG--YNRWARPVPNTSDV
:.::.:: .::. ::. ::. : :..
CCDS10 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSEL
10 20 30 40 50
90 100 110 120 130 140
pF1KE2 VIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSEMIWIP
: :.. .:.::::.: :..:.::::::: ::: ::.: :.: .: :. ..:.::. ::.:
CCDS10 VTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLP
60 70 80 90 100 110
150 160 170 180 190 200
pF1KE2 DIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCKMKFGS
:.:::::::: . :. ...: . :.. :.:::::::.:.:.: :::::::: ::: :
CCDS10 DVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRS
120 130 140 150 160 170
210 220 230 240 250 260
pF1KE2 WTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYAFVIRR
::::...::: ....: :. :::: :: : : . : : :.:: :.:::
CCDS10 WTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDST---YVDITYDFIIRR
180 190 200 210 220 230
270 280 290 300 310 320
pF1KE2 LPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEIIPSTSL
::::::::::::.::. :..::::::::::::.::::::::.::::::::..:.: :::
CCDS10 KPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSL
240 250 260 270 280 290
330 340 350 360 370 380
pF1KE2 VIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPRWLLMNRP
.::.:.::.:::..::.::: .: :::::::::.:::: ::. ..: .: :.:..:
CCDS10 DVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQP
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE2 PPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLCSHGHLH
. : ::.: . :. ::. : .: . : : . :
CCDS10 R---HHCARQRLRLRRRQREREGAGALFFREA--PGADSCTCFVNRASVQGLAGAFGAEP
360 370 380 390 400
450 460 470 480 490 500
pF1KE2 SGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVAMVIDRI
. ..:: . :: . ...:..::..::::.:::: :.::.::::::::::::.
CCDS10 APVAGPG-----RSGEPC-GCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRL
410 420 430 440 450 460
510 520
pF1KE2 FLWLFIIVCFLGTIGLFLPPFLAGMI
:::.:..:: .::::.:: :..
CCDS10 FLWIFVFVCVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK
470 480 490 500
529 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 04:15:17 2016 done: Sat Nov 5 04:15:17 2016
Total Scan time: 2.280 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]