FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5652, 505 aa
1>>>pF1KE5652 505 - 505 aa - 505 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2989+/-0.000986; mu= 18.3172+/- 0.059
mean_var=71.6170+/-14.165, 0's: 0 Z-trim(104.7): 75 B-trim: 46 in 1/49
Lambda= 0.151554
statistics sampled from 7945 (8023) to 7945 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.609), E-opt: 0.2 (0.246), width: 16
Scan time: 2.690
The best scores are: opt bits E(32554)
CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 3375 747.5 7.8e-216
CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 3091 685.4 3.7e-197
CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1864 417.1 2.2e-116
CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 1841 412.1 7.5e-115
CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 1702 381.7 1e-105
CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1620 363.9 3e-100
CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1595 358.3 1.1e-98
CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1345 303.6 2.9e-82
CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 1300 293.8 2.7e-79
CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 1292 292.1 9.7e-79
CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1291 291.8 1.1e-78
CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 1285 290.6 2.8e-78
CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 1220 276.3 5.4e-74
CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 1204 272.9 6.3e-73
CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 1164 264.1 2.5e-70
CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 1020 232.6 7.5e-61
CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 1014 231.3 1.8e-60
CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 870 199.8 5e-51
CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 687 159.8 6.3e-39
CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 683 158.9 1.1e-38
CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 676 157.4 3.4e-38
CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 656 152.9 5e-37
CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 628 146.9 5.1e-35
CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 591 138.8 1.3e-32
CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 563 132.7 8.7e-31
CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 563 132.7 8.9e-31
CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 563 132.7 9.6e-31
CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 562 132.5 1.1e-30
CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 537 127.0 4.4e-29
CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 524 124.1 3.1e-28
CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 504 119.8 7.1e-27
CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 472 112.8 8.2e-25
CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 472 112.8 8.5e-25
CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 393 95.2 5.8e-20
CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 393 95.5 1.4e-19
CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 351 86.1 4.5e-17
CCDS4358.1 GABRG2 gene_id:2566|Hs108|chr5 ( 467) 338 83.5 5.7e-16
CCDS3796.1 GLRB gene_id:2743|Hs108|chr4 ( 497) 334 82.6 1.1e-15
CCDS4359.1 GABRG2 gene_id:2566|Hs108|chr5 ( 475) 333 82.4 1.2e-15
CCDS45195.1 GABRG3 gene_id:2567|Hs108|chr15 ( 467) 325 80.6 4.1e-15
CCDS3470.1 GABRG1 gene_id:2565|Hs108|chr4 ( 465) 313 78.0 2.5e-14
CCDS10018.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 304 76.0 1e-13
CCDS10019.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 304 76.0 1e-13
CCDS54813.1 GLRB gene_id:2743|Hs108|chr4 ( 303) 300 75.0 1.3e-13
CCDS4354.1 GABRB2 gene_id:2561|Hs108|chr5 ( 474) 300 75.2 1.8e-13
CCDS4355.1 GABRB2 gene_id:2561|Hs108|chr5 ( 512) 300 75.2 1.9e-13
CCDS3474.1 GABRB1 gene_id:2560|Hs108|chr4 ( 474) 299 75.0 2.1e-13
CCDS54617.1 GABRR3 gene_id:200959|Hs108|chr3 ( 467) 293 73.6 5.2e-13
CCDS5020.3 GABRR2 gene_id:2570|Hs108|chr6 ( 465) 278 70.4 5.1e-12
CCDS14160.1 GLRA2 gene_id:2742|Hs108|chrX ( 452) 268 68.2 2.2e-11
>>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa)
initn: 3375 init1: 3375 opt: 3375 Z-score: 3988.4 bits: 747.5 E(32554): 7.8e-216
Smith-Waterman score: 3375; 100.0% identity (100.0% similar) in 505 aa overlap (1-505:1-505)
10 20 30 40 50 60
pF1KE5 MGSGPLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MGSGPLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 IIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 IVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSW
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 SYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIRRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIRRL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 PLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 IPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTRPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTRPT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 SNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFSANLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFSANLT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 RSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIFL
430 440 450 460 470 480
490 500
pF1KE5 WVFTLVCILGTAGLFLQPLMAREDA
:::::::::::::::::::::::::
CCDS10 WVFTLVCILGTAGLFLQPLMAREDA
490 500
>>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa)
initn: 3091 init1: 3091 opt: 3091 Z-score: 3653.0 bits: 685.4 E(32554): 3.7e-197
Smith-Waterman score: 3091; 99.8% identity (99.8% similar) in 465 aa overlap (1-465:1-465)
10 20 30 40 50 60
pF1KE5 MGSGPLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MGSGPLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 IIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 IVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSW
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 SYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIRRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIRRL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 PLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 IPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTRPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTRPT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 SNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFSANLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFSANLT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 RSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIFL
::::::::::::::::::::::::::::::::::::::::::: :
CCDS53 RSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEEQKAQEIQQLKRKEKST
430 440 450 460 470 480
490 500
pF1KE5 WVFTLVCILGTAGLFLQPLMAREDA
CCDS53 ETSDQEPGL
>>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa)
initn: 2175 init1: 1832 opt: 1864 Z-score: 2203.1 bits: 417.1 E(32554): 2.2e-116
Smith-Waterman score: 2191; 67.9% identity (85.4% similar) in 471 aa overlap (35-500:34-488)
10 20 30 40 50 60
pF1KE5 PLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPVIIHF
:.:::..:: ::..:::: :::::: .::
CCDS61 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 EVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPDIVLY
::...::..::::::::::::::..:::::::.:.: .: : : .::::.::::::::::
CCDS61 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 NNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSWSYDK
:::::::::. ::::::::.: .:: ::::::::: .:.:.::::.:::..:::::.:::
CCDS61 NNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYDK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 AKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIRRLPLFY
:.:::..:::.....:.::..:: :: : ::::::::::::::: :::::.::::::.::
CCDS61 AEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMFY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 TINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVIPLI
:::::::::.::::::::::::::::::::::::::::::::::::::::::::::.::.
CCDS61 TINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPLV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 GEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTRP---TS
::::::::::::::::.::::::.::::::::::: :::::::.:::.:..: : :
CCDS61 GEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLDKTR
310 320 330 340 350 360
370 380 390 400 410
pF1KE5 NEGNAQKPRPLYGAELSNLNCFSRAESKG--CKEGYPCQDGMCGYCHHRRIKISNFSANL
. :. :: : .: .:: ..: : . : .::. :: :.
CCDS61 GTGSDAVPRGL-----------ARRPAKGKLASHGEPRHLKECFHCHK-----SNELATS
370 380 390 400
420 430 440 450 460 470
pF1KE5 TRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIF
: : . .. :. : :::....:.::..::::::..::.::..:::::::::.::.:
CCDS61 KRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVF
410 420 430 440 450 460
480 490 500
pF1KE5 LWVFTLVCILGTAGLFLQPLMAREDA
:::: .::..::::::::::.
CCDS61 LWVFIIVCVFGTAGLFLQPLLGNTGKS
470 480 490
>>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa)
initn: 1864 init1: 1602 opt: 1841 Z-score: 2175.4 bits: 412.1 E(32554): 7.5e-115
Smith-Waterman score: 1842; 56.7% identity (76.1% similar) in 506 aa overlap (14-501:33-526)
10 20 30
pF1KE5 MGSGPLSLPLALSPPRLLLLLLLSLLPVA-----RASEAEHRL
::: : : :.: .:.: ::
CCDS60 PSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRL
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE5 FERLFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKW
:..::. ::. ::: :.:: ::..: .:..::. ::: ::.: ::.:::: :.::::.:
CCDS60 FKHLFRGYNRWARPVPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRW
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE5 NPSDYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSS
::.:.:. .:::.. :: ::::::::: :.: : ::: : :: : :.::::.:::
CCDS60 NPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSS
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE5 CKIDVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHD
:.::::.:::: ::: ::::::.:::::::: . ....::::::::::::..: : ..
CCDS60 CSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNS
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE5 IKYNCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCIS
::.:: :::::.::.. :::::::::::::::::::: :::::::::::::::.:::::
CCDS60 KKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCIS
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE5 VLLSLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTM
::::::::::.::: ::::::::::::::::::::::::::::::::::::.:.:.::::
CCDS60 VLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTM
310 320 330 340 350 360
340 350 360 370 380
pF1KE5 PSWVKTVFLNLLPRVMFMTRPTSNEGNAQKPR----PLYGAELSNLNCFSRA-----ESK
: ::. ..:. .:: ..:.:: . : : : ::.. : :..
CCDS60 PHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDR
370 380 390 400 410 420
390 400 410 420 430 440
pF1KE5 GCKEGY--PCQDGMCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSAL--SPEIKEAI
:. : .:.. : : ..:. ...:.:. . : ::....:.
CCDS60 WACAGHVAPSVGTLCSHGH------------LHSGASGPKAEALLQEGELLLSPHMQKAL
430 440 450 460 470
450 460 470 480 490 500
pF1KE5 QSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIFLWVFTLVCILGTAGLFLQPLMAREDA
..:.:::....... . ...:::::::::::::::.: .::.::: :::: :..:
CCDS60 EGVHYIADHLRSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
480 490 500 510 520
>>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa)
initn: 1810 init1: 1464 opt: 1702 Z-score: 2011.4 bits: 381.7 E(32554): 1e-105
Smith-Waterman score: 1762; 55.5% identity (73.7% similar) in 506 aa overlap (14-501:33-511)
10 20 30
pF1KE5 MGSGPLSLPLALSPPRLLLLLLLSLLPVA-----RASEAEHRL
::: : : :.: .:.: ::
CCDS64 PSCPVFLSFTKLSLWWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRL
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE5 FERLFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKW
:..::. ::. ::: :.:: ::: ::.: ::.:::: :.::::.:
CCDS64 FKHLFRGYNRWARPVPNTSD---------------VDEKNQMMTTNVWLKQEWSDYKLRW
70 80 90 100
100 110 120 130 140 150
pF1KE5 NPSDYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSS
::.:.:. .:::.. :: ::::::::: :.: : ::: : :: : :.::::.:::
CCDS64 NPTDFGNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSS
110 120 130 140 150 160
160 170 180 190 200 210
pF1KE5 CKIDVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHD
:.::::.:::: ::: ::::::.:::::::: . ....::::::::::::..: : ..
CCDS64 CSIDVTFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNS
170 180 190 200 210 220
220 230 240 250 260 270
pF1KE5 IKYNCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCIS
::.:: :::::.::.. :::::::::::::::::::: :::::::::::::::.:::::
CCDS64 KKYDCCAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCIS
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE5 VLLSLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTM
::::::::::.::: ::::::::::::::::::::::::::::::::::::.:.:.::::
CCDS64 VLLSLTVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTM
290 300 310 320 330 340
340 350 360 370 380
pF1KE5 PSWVKTVFLNLLPRVMFMTRPTSNEGNAQKPR----PLYGAELSNLNCFSRA-----ESK
: ::. ..:. .:: ..:.:: . : : : ::.. : :..
CCDS64 PHWVRGALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDR
350 360 370 380 390 400
390 400 410 420 430 440
pF1KE5 GCKEGY--PCQDGMCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSAL--SPEIKEAI
:. : .:.. : : ..:. ...:.:. . : ::....:.
CCDS64 WACAGHVAPSVGTLCSHGH------------LHSGASGPKAEALLQEGELLLSPHMQKAL
410 420 430 440 450
450 460 470 480 490 500
pF1KE5 QSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIFLWVFTLVCILGTAGLFLQPLMAREDA
..:.:::....... . ...:::::::::::::::.: .::.::: :::: :..:
CCDS64 EGVHYIADHLRSEDADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
460 470 480 490 500 510
>>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa)
initn: 1909 init1: 1592 opt: 1620 Z-score: 1913.2 bits: 363.9 E(32554): 3e-100
Smith-Waterman score: 1620; 66.1% identity (83.6% similar) in 360 aa overlap (12-368:11-370)
10 20 30 40 50
pF1KE5 MGSGPLSLPLALSPPRLLLL---LLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVS
: :: :::: :: . : ..::.::...:: ::. :::::.:
CCDS13 MELGGPGAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANIS
10 20 30 40 50
60 70 80 90 100 110
pF1KE5 DPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIW
: :...: .:..::. ::: ::.: ::.:.:: :.::::.:.:.:: .. .:.:.. ::
CCDS13 DVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIW
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE5 KPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKF
.::::::::: ::: : ::: : . :.: : ::::.::::.::::.:::: :::::::
CCDS13 RPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE5 GSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYI
:::.::::::::: . : .. :.::::::.:. : : . ::.:: ::::::::.. :
CCDS13 GSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFVI
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE5 RRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPST
::::::::::::::::::: ::::::::::.::::.:::::::::::::::.::: ::::
CCDS13 RRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPST
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE5 SLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMT
::::::::::::::::::::::::::::::::.:.: :::::.::. :::...::...:
CCDS13 SLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLLMK
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE5 RPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFSA
::. . : ..
CCDS13 RPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAEPG
360 370 380 390 400 410
>--
initn: 324 init1: 278 opt: 284 Z-score: 334.5 bits: 71.8 E(32554): 2.6e-12
Smith-Waterman score: 284; 40.6% identity (66.4% similar) in 128 aa overlap (374-501:508-624)
350 360 370 380 390 400
pF1KE5 TVFLNLLPRVMFMTRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCG
:: :.. : : :: . ::. :
CCDS13 VEGGVRCRSRSIQYCVPRDDAAPEADGQAAGA-LASRNTHS-AELPPPDQPSPCK---CT
480 490 500 510 520 530
410 420 430 440 450 460
pF1KE5 YCHHRRIKISNFSANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKE
:... ..: .. :::... ::: . .:...:.:::...::..
CCDS13 -CKKEPSSVSPSATVKTRSTKAPPPHL-----PLSPALTRAVEGVQYIADHLKAEDTDFS
540 550 560 570 580
470 480 490 500
pF1KE5 IQDDWKYVAMVIDRIFLWVFTLVCILGTAGLFLQPLMAREDA
...:::::::::::::::.: .::.:::.:::: : .:
CCDS13 VKEDWKYVAMVIDRIFLWMFIIVCLLGTVGLFLPPWLAGMI
590 600 610 620
>>CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 (479 aa)
initn: 2069 init1: 1563 opt: 1595 Z-score: 1885.4 bits: 358.3 E(32554): 1.1e-98
Smith-Waterman score: 2059; 65.2% identity (82.2% similar) in 471 aa overlap (35-500:34-473)
10 20 30 40 50 60
pF1KE5 PLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPVIIHF
:.:::..:: ::..:::: :::::: .::
CCDS56 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 EVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPDIVLY
::...::..: :::::::.:.: .: : : .::::.::::::::::
CCDS56 EVAITQLANV---------------IWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY
70 80 90 100
130 140 150 160 170 180
pF1KE5 NNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSWSYDK
:::::::::. ::::::::.: .:: ::::::::: .:.:.::::.:::..:::::.:::
CCDS56 NNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYDK
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE5 AKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIRRLPLFY
:.:::..:::.....:.::..:: :: : ::::::::::::::: :::::.::::::.::
CCDS56 AEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMFY
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE5 TINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVIPLI
:::::::::.::::::::::::::::::::::::::::::::::::::::::::::.::.
CCDS56 TINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPLV
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE5 GEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTRP---TS
::::::::::::::::.::::::.::::::::::: :::::::.:::.:..: : :
CCDS56 GEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLDKTR
290 300 310 320 330 340
370 380 390 400 410
pF1KE5 NEGNAQKPRPLYGAELSNLNCFSRAESKG--CKEGYPCQDGMCGYCHHRRIKISNFSANL
. :. :: : .: .:: ..: : . : .::. :: :.
CCDS56 GTGSDAVPRGL-----------ARRPAKGKLASHGEPRHLKECFHCHK-----SNELATS
350 360 370 380 390
420 430 440 450 460 470
pF1KE5 TRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIF
: : . .. :. : :::....:.::..::::::..::.::..:::::::::.::.:
CCDS56 KRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVF
400 410 420 430 440 450
480 490 500
pF1KE5 LWVFTLVCILGTAGLFLQPLMAREDA
:::: .::..::::::::::.
CCDS56 LWVFIIVCVFGTAGLFLQPLLGNTGKS
460 470
>>CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 (457 aa)
initn: 1534 init1: 758 opt: 1345 Z-score: 1590.3 bits: 303.6 E(32554): 2.9e-82
Smith-Waterman score: 1479; 47.7% identity (72.7% similar) in 488 aa overlap (12-495:1-446)
10 20 30 40 50 60
pF1KE5 MGSGPLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPV
. : ::::. : .. .:: : :: .::.::. ..::: . . :
CCDS22 MEPWPLLLLFSLCSAGLVLGSEHETRLVAKLFKDYSSVVRPVEDHRQVV
10 20 30 40
70 80 90 100 110 120
pF1KE5 IIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPD
. ... ::..:::::::. ::. ::: : ::.:::::.::::.. ...:..:::.::
CCDS22 EVTVGLQLIQLINVDEVNQIVTTNVRLKQQWVDYNLKWNPDDYGGVKKIHIPSEKIWRPD
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE5 IVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSW
.:::::: ::: . ::.::.:::..:: ::::::: :.: ::.:::: :::.::.:.:
CCDS22 LVLYNNADGDFAIVKFTKVLLQYTGHITWTPPAIFKSYCEIIVTHFPFDEQNCSMKLGTW
110 120 130 140 150 160
190 200 210 220 230
pF1KE5 SYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEI-YPDITYSLYIRR
.:: . . . ... .:... :::::.: .. :.::.. :.:: . : :::: . ..:
CCDS22 TYDGSVVAINPESDQPDLSNFMESGEWVIKESRGWKHSVTYSCCPDTPYLDITYHFVMQR
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE5 LPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSL
:::.. .:.::::::.:::: ::::::.: :::.:: ::::::::::::::.: :::::
CCDS22 LPLYFIVNVIIPCLLFSFLTGLVFYLPTDSGEKMTLSISVLLSLTVFLLVIVELIPSTSS
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE5 VIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMF---M
..::::.:.::::.:: ::.:::.:.:.:.:.:.::.::.::. ::.. .: .:: :
CCDS22 AVPLIGKYMLFTMVFVIASIIITVIVINTHHRSPSTHVMPNWVRKVFIDTIPNIMFFSTM
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE5 TRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFS
::. . .. . .. .. ... .: : : : :. : ::
CCDS22 KRPSRE----KQDKKIFTEDI-DISDIS---------GKPGPPPM-GF-HSPLIK-----
350 360 370 380
420 430 440 450 460 470
pF1KE5 ANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVID
::.: ::...:::::.::...:... .:::::::.:
CCDS22 ---------------------HPEVKSAIEGIKYIAETMKSDQESNNAAAEWKYVAMVMD
390 400 410 420
480 490 500
pF1KE5 RIFLWVFTLVCILGTAGLFLQPLMAREDA
.:.: :: ::::.:: ..:
CCDS22 HILLGVFMLVCIIGTLAVFAGRLIELNQQG
430 440 450
>>CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 (468 aa)
initn: 1470 init1: 523 opt: 1300 Z-score: 1536.9 bits: 293.8 E(32554): 2.7e-79
Smith-Waterman score: 1385; 44.7% identity (68.6% similar) in 510 aa overlap (13-502:6-453)
10 20 30 40
pF1KE5 MGSGPLSLPLALSPPRLLLLLLLSLLPVAR-----------------ASEAEHR--LFER
: :: : :::: : ..: .: :.:. :..
CCDS10 MAARGSGPRALRLLLLVQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKD
10 20 30 40 50
50 60 70 80 90 100
pF1KE5 LFEDYNEIIRPVANVSDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPS
::.::.. .::: ...: . :.: ...:::: ::: ::.: ::.:::: : : ::.:::.
CCDS10 LFQDYERWVRPVEHLNDKIKIKFGLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPD
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE5 DYGGAEFMRVPAQKIWKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKI
:::: . .:::....: :::::..:: : :. .::....:.: ::: ::: .:::: :
CCDS10 DYGGIKVIRVPSDSVWTPDIVLFDNADGRFE-GTSTKTVIRYNGTVTWTPPANYKSSCTI
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE5 DVTYFPFDYQNCTMKFGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKY
:::.:::: :::.::::::.:: ...:..: .... .:....::: :..: : : .
CCDS10 DVTFFPFDLQNCSMKFGSWTYDGSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTD
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE5 NCCEEIYPDITYSLYIRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLL
.:: :: .:::. :.:::::::. :::::. .::::::::::::. :::. :: :::.
CCDS10 SCC--WYPYVTYSFVIKRLPLFYTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLV
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE5 SLTVFLLVITETIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHT-MPS
::::::::: : :::.: :::::::::.::::::::::..:::..:.:.:. .::. :
CCDS10 SLTVFLLVIEEIIPSSSKVIPLIGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAP
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE5 WVKTVFLNLLPRVMFMTRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDG
:. .::. ::... : : .. .:: . :. : :
CCDS10 LVRKIFLHTLPKLLCM-RSHVDRYFTQKEETESGS--------------GPK--------
360 370 380
410 420 430 440 450 460
pF1KE5 MCGYCHHRRIKISNFSANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNE
:: ....: :..:..::.... .:.
CCDS10 ----------------------SSRNTLEA-------------ALDSIRYITRHIMKEND
390 400 410
470 480 490 500
pF1KE5 AKEIQDDWKYVAMVIDRIFLWVFTLVCILGTAGLFLQPLMAREDA
..:. .:::..:.:.::.:::.: .: :.:. :::. :.. .
CCDS10 VREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLGLFV-PVIYKWANILIPVHIGNANK
420 430 440 450 460
>>CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 (498 aa)
initn: 1514 init1: 670 opt: 1292 Z-score: 1527.1 bits: 292.1 E(32554): 9.7e-79
Smith-Waterman score: 1519; 46.5% identity (74.1% similar) in 495 aa overlap (15-505:5-488)
10 20 30 40 50
pF1KE5 MGSGPLSLPLALSPPRLLLLLLLSLLPVA--RASEAEHRLFERLFED--YNEIIRPVANV
: :.:..:..: . :...::..:.. :.. ::..:::...
CCDS10 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSS
10 20 30 40 50
60 70 80 90 100 110
pF1KE5 SDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKI
:. . :....:..::..:.: .::: ::.:::: :.::.: :: : : :....:.::..:
CCDS10 SQLISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE5 WKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMK
: ::::::::: : ..:. :. ... .: : :.::::.::.:::.: ::::: ::::.:
CCDS10 WLPDIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE5 FGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLY
: ::.::...::.::. . .. :. :::: :. :: . : . : :.::..
CCDS10 FRSWTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRR---TVNPQDPSYVDVTYDFI
180 190 200 210 220
240 250 260 270 280 290
pF1KE5 IRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPS
:.: ::::::::::::.: ..:..::::::::::::.::::::::.:: :::.:.. .:
CCDS10 IKRKPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPP
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE5 TSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFM
::: .::::.::.:::..::.::: .: :::::.:.:.:::: ::: ::. :: .::
CCDS10 TSLDVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFM
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE5 TRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFS
:: . . :. : . .: .. :. . . . : : . :.
CCDS10 KRPGPDSSPARAFPP-------SKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSP
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE5 ANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVID
:. : . .. . : . . ...::...:..::..:: ..: . . .::::::::.:
CCDS10 AGSTPVAIPRDF-WLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVD
410 420 430 440 450
480 490 500
pF1KE5 RIFLWVFTLVCILGTAGLFLQPLMAREDA
:.::::: .::.:::.:::: ::. . :
CCDS10 RLFLWVFMFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD
460 470 480 490
505 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 10:37:57 2016 done: Tue Nov 8 10:37:57 2016
Total Scan time: 2.690 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]