FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2392, 517 aa
1>>>pF1KE2392 517 - 517 aa - 517 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.1166+/-0.000841; mu= 19.0357+/- 0.051
mean_var=66.1749+/-13.503, 0's: 0 Z-trim(106.9): 76 B-trim: 485 in 1/49
Lambda= 0.157662
statistics sampled from 9181 (9257) to 9181 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.652), E-opt: 0.2 (0.284), width: 16
Scan time: 3.390
The best scores are: opt bits E(32554)
CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 3498 804.7 0
CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 1547 361.0 1.9e-99
CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 1407 329.1 7.1e-90
CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 1333 312.3 8.4e-85
CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 1290 302.5 7.4e-82
CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 669 161.2 2.4e-39
CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 664 160.1 5e-39
CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 662 159.6 7.4e-39
CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 594 144.2 4e-34
CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 572 139.2 1.1e-32
CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 563 137.1 4.4e-32
CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 563 137.1 4.5e-32
CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 558 136.0 9.1e-32
CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 558 136.0 9.6e-32
CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 557 135.7 1e-31
CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 538 131.4 2.2e-30
CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 525 128.5 1.7e-29
CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 521 127.6 3.2e-29
CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 516 126.4 6.9e-29
CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 507 124.4 2.9e-28
CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 498 122.3 1.3e-27
CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 497 122.1 1.5e-27
CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 492 121.0 3.4e-27
CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 489 120.3 5.3e-27
CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 423 105.3 1.7e-22
CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 422 105.0 1.9e-22
CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 422 105.0 1.9e-22
CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 409 102.1 1.4e-21
CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 379 95.2 1.6e-19
CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 367 92.4 8.2e-19
CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 367 92.5 1e-18
CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 360 90.9 3.2e-18
CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 360 90.9 3.3e-18
CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 353 89.1 5.7e-18
CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 346 87.4 1.3e-17
CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 297 76.6 7e-14
CCDS3796.1 GLRB gene_id:2743|Hs108|chr4 ( 497) 277 72.1 1.7e-12
CCDS4357.1 GABRA1 gene_id:2554|Hs108|chr5 ( 456) 257 67.5 3.7e-11
CCDS54813.1 GLRB gene_id:2743|Hs108|chr4 ( 303) 251 66.0 6.8e-11
>>CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 (517 aa)
initn: 3498 init1: 3498 opt: 3498 Z-score: 4297.2 bits: 804.7 E(32554): 0
Smith-Waterman score: 3498; 100.0% identity (100.0% similar) in 517 aa overlap (1-517:1-517)
10 20 30 40 50 60
pF1KE2 MHGGQGPLLLLLLLAVCLGAQGRNQEERLLADLMQNYDPNLRPAERDSDVVNVSLKLTLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MHGGQGPLLLLLLLAVCLGAQGRNQEERLLADLMQNYDPNLRPAERDSDVVNVSLKLTLT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 NLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLENNVDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLENNVDG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 VFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYSTNEIDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYSTNEIDL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 QLSQEDGQTIEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGHQKVVFYLLIQRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QLSQEDGQTIEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGHQKVVFYLLIQRK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 PLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLVAKKVPETSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLVAKKVPETSQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 AVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLLPQLLRMHVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLLPQLLRMHVR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 PLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQQWQRQGLVAAALEKLEKGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQQWQRQGLVAAALEKLEKGP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 ELGLSQFCGSLKQAAPAIQACVEACNLIACARHQQSHFDNGNEEWFLVGRVLDRVCFLAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ELGLSQFCGSLKQAAPAIQACVEACNLIACARHQQSHFDNGNEEWFLVGRVLDRVCFLAM
430 440 450 460 470 480
490 500 510
pF1KE2 LSLFICGTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
:::::::::::::::::::::::::::::::::::::
CCDS33 LSLFICGTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
490 500 510
>>CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 (517 aa)
initn: 1119 init1: 617 opt: 1547 Z-score: 1898.8 bits: 361.0 E(32554): 1.9e-99
Smith-Waterman score: 1547; 48.0% identity (74.5% similar) in 521 aa overlap (5-512:2-509)
10 20 30 40 50
pF1KE2 MHGGQGPLL---LLLLLAVCLGAQGRNQEERLLADLMQN--YDPNLRPAERDSDVVNVSL
.::.: :: :::: :. : :.::::. :.:. :. .:::. . . :.:.:
CCDS24 MEGPVLTLGLLAALAVC-GSWGLNEEERLIRHLFQEKGYNKELRPVAHKEESVDVAL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 KLTLTNLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLE
:::.:::::.: ::.:::::::: : : ::.:. ... .. :::.: ::: :.::::
CCDS24 ALTLSNLISLKEVEETLTTNVWIEHGWTDNRLKWNAEEFGNISVLRLPPDMVWLPEIVLE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 NNVDGVFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYST
:: :: :... ::::: : .::::::::::.: ::::::::::::::: :.: :..
CCDS24 NNNDGSFQISYSCNVLVYHYGFVYWLPPAIFRSSCPISVTYFPFDWQNCSLKFSSLKYTA
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 NEIDLQLSQEDGQT----IEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGHQKV
.:: :.:.:. .. .:::.::::.::::::: : ::::.. .:: :: . ..: .
CCDS24 KEITLSLKQDAKENRTYPVEWIIIDPEGFTENGEWEIVHRPARVNVDPRAPLDSPSRQDI
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 VFYLLIQRKPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLV
.:::.:.::::::.:::..:::::: .. :. .::: .: .: .:::.:::::.:::.:.
CCDS24 TFYLIIRRKPLFYIINILVPCVLISFMVNLVFYLPADSG-EKTSVAISVLLAQSVFLLLI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 AKKVPETSQAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLL
.:..: ::.:.:::.:.: : .:.. ..:: :.:::. .:.: :: ...::.:.::. :
CCDS24 SKRLPATSMAIPLIGKFLLFGMVLVTMVVVICVIVLNIHFRTPSTHVLSEGVKKLFLETL
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 PQLLRMHVRPLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQ-QWQRQGLVA
:.::.: :: . . : ...: :. :. .:: : ::.:.:. : .:.:: :
CCDS24 PELLHMS-RPAEDGPSPGALVR-RSSSLGY-ISKAEEYFLLKSRSDLMFEKQSERHGL-A
360 370 380 390 400 410
420 430 440 450 460
pF1KE2 AALEKLEKGP---ELGLSQFCGSLKQAAPAIQACVEACNLIACARHQQSHFDNGNEEWFL
: .. : : . ... . :: :: :.. :.:. ..:..... .. :
CCDS24 RRLTTARRPPASSEQAQQELFNELK---PA----VDGANFIVNHMRDQNNYNEEKDSWNR
420 430 440 450 460
470 480 490 500 510
pF1KE2 VGRVLDRVCFLAMLSLFICGTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
:.:..::.:.... ... ::: :::.. ::. : :::::: :
CCDS24 VARTVDRLCLFVVTPVMVVGTAWIFLQGVYNQPPPQPFPGDPYSYNVQDKRFI
470 480 490 500 510
>>CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 (493 aa)
initn: 1608 init1: 695 opt: 1407 Z-score: 1727.0 bits: 329.1 E(32554): 7.1e-90
Smith-Waterman score: 1601; 50.7% identity (74.5% similar) in 509 aa overlap (5-511:3-493)
10 20 30 40 50 60
pF1KE2 MHGGQGPLLLLLLLAVCLGAQGRNQEERLLADLMQNYDPNLRPAERDSDVVNVSLKLTLT
..:: .::::.. . :.:.: :: :..::::. ::... :.:..:::.:::
CCDS11 MARAPLGVLLLLGLLGRGVGKNEELRLYHHLFNNYDPGSRPVREPEDTVTISLKVTLT
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 NLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLENNVDG
:::::::.::.:::.::: ..: :::: .. :. :. .::::: .:: :.::::::.::
CCDS11 NLISLNEKEETLTTSVWIGIDWQDYRLNYSKDDFGGIETLRVPSELVWLPEIVLENNIDG
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 VFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYSTNEIDL
: :: :::: : . ::::::.::.:.. :::::::::::::::.::::...:...
CCDS11 QFGVAYDANVLVYEGGSVTWLPPAIYRSVCAVEVTYFPFDWQNCSLIFRSQTYNAEEVEF
120 130 140 150 160 170
190 200 210 220 230
pF1KE2 QLS-QEDGQTIEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGHQKVVFYLLIQR
.. ..::.::. : :: ::.::::::::. :. . .. .. :. :.. :.:.:
CCDS11 TFAVDNDGKTINKIDIDTEAYTENGEWAIDFCPGVIRRHHGGATDGPGETDVIYSLIIRR
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 KPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLVAKKVPETS
::::::::::.::::::....: .::::.::::::::.:::::::::::::.:.:.::::
CCDS11 KPLFYVINIIVPCVLISGLVLLAYFLPAQAGGQKCTVSINVLLAQTVFLFLIAQKIPETS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 QAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLLPQLLRMHV
.:::....: :..::. :::.: :.::::: :.: ::.:. .:.:.:.:::.::
CCDS11 LSVPLLGRFLIFVMVVATLIVMNCVIVLNVSQRTPTTHAMSPRLRHVLLELLPRLLGSPP
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 RPLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQ-QWQRQGLVAAALEKLEK
: :: :.. . .:: . .::. : :::::.:. : .::: .::
CCDS11 PPEAPRAASPPRR----ASSVGLLLRAEELILKKPRSELVFEGQRHRQGTWTAA------
360 370 380 390 400
420 430 440 450 460 470
pF1KE2 GPELGLSQFCGSLKQAAPAIQACVEACNLIACARHQQSHFDNGNEEWFLVGRVLDRVCFL
:: :: ::: .. ::.: :..: . ..: . .: .: .:: .::
CCDS11 --------FCQSLGAAAPEVRCCVDAVNFVAESTRDQEATGEEVSDWVRMGNALDNICFW
410 420 430 440 450 460
480 490 500 510
pF1KE2 AMLSLFICGTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
: : :: :.. ::: :..:::: ::. .:
CCDS11 AALVLFSVGSSLIFLGAYFNRVPDLPYAPCIQP
470 480 490
>>CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 (502 aa)
initn: 978 init1: 476 opt: 1333 Z-score: 1635.9 bits: 312.3 E(32554): 8.4e-85
Smith-Waterman score: 1442; 45.9% identity (72.2% similar) in 521 aa overlap (5-512:2-494)
10 20 30 40 50
pF1KE2 MHGGQGPLL---LLLLLAVCLGAQGRNQEERLLADLMQN--YDPNLRPAERDSDVVNVSL
.::.: :: :::: :. : :.::::. :.:. :. .:::. . . :.:.:
CCDS58 MEGPVLTLGLLAALAVC-GSWGLNEEERLIRHLFQEKGYNKELRPVAHKEESVDVAL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 KLTLTNLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLE
:::.:::::. : : ::.:. ... .. :::.: ::: :.::::
CCDS58 ALTLSNLISLG---------------WTDNRLKWNAEEFGNISVLRLPPDMVWLPEIVLE
60 70 80 90 100
120 130 140 150 160 170
pF1KE2 NNVDGVFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYST
:: :: :... ::::: : .::::::::::.: ::::::::::::::: :.: :..
CCDS58 NNNDGSFQISYSCNVLVYHYGFVYWLPPAIFRSSCPISVTYFPFDWQNCSLKFSSLKYTA
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE2 NEIDLQLSQEDGQT----IEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGHQKV
.:: :.:.:. .. .:::.::::.::::::: : ::::.. .:: :: . ..: .
CCDS58 KEITLSLKQDAKENRTYPVEWIIIDPEGFTENGEWEIVHRPARVNVDPRAPLDSPSRQDI
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE2 VFYLLIQRKPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLV
.:::.:.::::::.:::..:::::: .. :. .::: .: .: .:::.:::::.:::.:.
CCDS58 TFYLIIRRKPLFYIINILVPCVLISFMVNLVFYLPADSG-EKTSVAISVLLAQSVFLLLI
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE2 AKKVPETSQAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLL
.:..: ::.:.:::.:.: : .:.. ..:: :.:::. .:.: :: ...::.:.::. :
CCDS58 SKRLPATSMAIPLIGKFLLFGMVLVTMVVVICVIVLNIHFRTPSTHVLSEGVKKLFLETL
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE2 PQLLRMHVRPLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQ-QWQRQGLVA
:.::.: :: . . : ...: :. :. .:: : ::.:.:. : .:.:: :
CCDS58 PELLHMS-RPAEDGPSPGALVR-RSSSLGY-ISKAEEYFLLKSRSDLMFEKQSERHGL-A
350 360 370 380 390
420 430 440 450 460
pF1KE2 AALEKLEKGP---ELGLSQFCGSLKQAAPAIQACVEACNLIACARHQQSHFDNGNEEWFL
: .. : : . ... . :: :: :.. :.:. ..:..... .. :
CCDS58 RRLTTARRPPASSEQAQQELFNELK---PA----VDGANFIVNHMRDQNNYNEEKDSWNR
400 410 420 430 440
470 480 490 500 510
pF1KE2 VGRVLDRVCFLAMLSLFICGTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
:.:..::.:.... ... ::: :::.. ::. : :::::: :
CCDS58 VARTVDRLCLFVVTPVMVVGTAWIFLQGVYNQPPPQPFPGDPYSYNVQDKRFI
450 460 470 480 490 500
>>CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 (501 aa)
initn: 1046 init1: 607 opt: 1290 Z-score: 1583.1 bits: 302.5 E(32554): 7.4e-82
Smith-Waterman score: 1290; 42.5% identity (69.6% similar) in 510 aa overlap (6-506:4-501)
10 20 30 40 50
pF1KE2 MHGGQGPLLLLL-LLAVCL--GAQGRNQEERLLADLMQNYDPNLRPAERDSDVVNVSLKL
: ::.:: :.. : :..: . : :: :...:: ..:::.. .: : ::. :
CCDS11 MTPGALLMLLGALGAPLAPGVRGSEAEGRLREKLFSGYDSSVRPAREVGDRVRVSVGL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 TLTNLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLENN
:..::::::..: ..:.:.....: :::: ::: ...:. ::. . :: ::.:: ::
CCDS11 ILAQLISLNEKDEEMSTKVYLDLEWTDYRLSWDPAEHDGIDSLRITAESVWLPDVVLLNN
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 VDGVFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYSTNE
:: :.::: .:.:: :: . : ::.:.::.:::.:::::::::::...:.: .:...:
CCDS11 NDGNFDVALDISVVVSSDGSVRWQPPGIYRSSCSIQVTYFPFDWQNCTMVFSSYSYDSSE
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 IDLQLSQ-EDGQTIEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAP--AQEAGHQKVVFY
..:: . ::: . : : .: :::.: : :.:.... :. : ..:. .:.:.::
CCDS11 VSLQTGLGPDGQGHQEIHIHEGTFIENGQWEIIHKPSRLIQPPGDPRGGREGQRQEVIFY
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 LLIQRKPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLVAKK
:.:.::::::..:.::::.::. .::.. .:: :: .: ..: .::. ::::.:.: :
CCDS11 LIIRRKPLFYLVNVIAPCILITLLAIFVFYLPPDAG-EKMGLSIFALLTLTVFLLLLADK
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 VPETSQAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLLPQL
::::: .::.: ::: : .:.. . :. .:::::. ::::::.: ::..:.. ::
CCDS11 VPETSLSVPIIIKYLMFTMVLVTFSVILSVVVLNLHHRSPHTHQMPLWVRQIFIHKLPLY
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 LRMHVRPLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQQWQR--QGLVAAA
::.. :: .. . .. .:::. : .: . : :..:: . .: : :
CCDS11 LRLK-RPKPERDLMPEPPHCSSPGSGWGRGT-DEYFIRKPPSDFLFPKPNRFQPELSAPD
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 LEKLEKGPELGLSQFCGSLKQAAPAIQACVEACNLIACARHQQSHFDNGNEEWFLVGRVL
:... ::. ... . : .. : . . :: ..: : .:.: .:. :.
CCDS11 LRRFIDGPNRAVALL--------PELREVVSSISYIARQLQEQEDHDALKEDWQFVAMVV
420 430 440 450 460
480 490 500 510
pF1KE2 DRVCFLAMLSLFIC-GTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
::. :: . .: :: ::: : :. : :::
CCDS11 DRL-FLWTFIIFTSVGTLVIFLDATYHLPPPDPFP
470 480 490 500
>>CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 (498 aa)
initn: 911 init1: 579 opt: 669 Z-score: 819.7 bits: 161.2 E(32554): 2.4e-39
Smith-Waterman score: 1101; 39.5% identity (67.7% similar) in 499 aa overlap (8-493:7-479)
10 20 30 40 50
pF1KE2 MHGGQGPLLLLLLLAVCLGAQGR--NQEERLLADLMQN--YDPNLRPAERDSDVVNVSLK
:.:..:.:.: .. : : ::.:. ::... :. .::: .:......:.
CCDS10 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQLISIKLQ
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 LTLTNLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLEN
:.:..:::.::::. .:::::....: :::: :. :::. .::.:. .: ::::: :
CCDS10 LSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLPDIVLYN
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 NVDGVFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYSTN
:.::..::..: :..: .: . ::::::..:::.: : ::::: :::.: :.: ::. .
CCDS10 NADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRSWTYDHT
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 EIDLQLSQEDGQTIEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGHQKVVFYLL
:::. : .. . :: .::: : :.. ..: :. .. :.. ..
CCDS10 EIDMVLMTPTASM--------DDFTPSGEWDIVALPGRRTVNP----QDPSYVDVTYDFI
180 190 200 210 220
240 250 260 270 280 290
pF1KE2 IQRKPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLVAKKVP
:.::::::.::.: :::: . .:::. .::. : .: :. :.:::: : ::.:..: ::
CCDS10 IKRKPLFYTINLIIPCVLTTLLAILVFYLPSDCG-EKMTLCISVLLALTFFLLLISKIVP
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE2 ETSQAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLLPQLLR
:: ::::.::: : .:.. . .:..: :::: ::: ::.:: :.. ::. :: .:
CCDS10 PTSLDVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLF
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE2 MHVRPLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQQWQRQGLVAAALEKL
:. :: .: :.. : .: : .: :.. .. . ..:: ..
CCDS10 MK-RP-GP----DSSPARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSP
350 360 370 380 390 400
420 430 440 450 460
pF1KE2 EKGPELGLSQ-F----CGSLKQAAPAIQACVEACNLIACARHQQSHFDNGN--EEWFLVG
. ... . : : ..: .: .:. ..: :.:... .. . :.: :.
CCDS10 AGSTPVAIPRDFWLRSSGRFRQD---VQEALEGVSFI--AQHMKNDDEDQSVVEDWKYVA
410 420 430 440 450
470 480 490 500 510
pF1KE2 RVLDRVCFLAMLSLFIC--GTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
:.::. :: .. .:.: ::.:.::
CCDS10 MVVDRL-FLWVF-MFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD
460 470 480 490
>>CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 (457 aa)
initn: 814 init1: 516 opt: 664 Z-score: 814.1 bits: 160.1 E(32554): 5e-39
Smith-Waterman score: 898; 33.5% identity (63.6% similar) in 489 aa overlap (7-492:3-446)
10 20 30 40 50
pF1KE2 MHGGQGPLLLLLLLAVCLGAQ--GRNQEERLLADLMQNYDPNLRPAERDSDVVNVSLKLT
: ::::...: .. : ..: ::.: :...:. .::.: .::.:.. :
CCDS22 MEPWPLLLLFSLCSAGLVLGSEHETRLVAKLFKDYSSVVRPVEDHRQVVEVTVGLQ
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 LTNLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLENNV
: .::...: .. .:::: ...:: :: :.:.: :: :. ...:: .::::.:: ::.
CCDS22 LIQLINVDEVNQIVTTNVRLKQQWVDYNLKWNPDDYGGVKKIHIPSEKIWRPDLVLYNNA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 DGVFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYSTNEI
:: : .. . .::.. : : : :::::.: : : ::.:::: ::::. . . ::. . .
CCDS22 DGDFAIVKFTKVLLQYTGHITWTPPAIFKSYCEIIVTHFPFDEQNCSMKLGTWTYDGSVV
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 DLQLSQEDGQTIEWIFIDPEAFTENGEWAIQH-RPAKMLLDPAAPAQEAGHQKVVFYLLI
.. :. : : : :.:::.:.. : : . . .. . .......
CCDS22 --AINPESDQP------DLSNFMESGEWVIKESRGWKHSVTYSC-CPDTPYLDITYHFVM
180 190 200 210 220
240 250 260 270 280 290
pF1KE2 QRKPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLVAKKVPE
:: ::....:.: ::.:.: .. :. .::. .: .: :..:.:::. ::::..... .:
CCDS22 QRLPLYFIVNVIIPCLLFSFLTGLVFYLPTDSG-EKMTLSISVLLSLTVFLLVIVELIPS
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE2 TSQAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLLPQLLRM
::.:::::.::. : .: .: .. .:.:.:. ::: :: : :::::. .:... .
CCDS22 TSSAVPLIGKYMLFTMVFVIASIIITVIVINTHHRSPSTHVMPNWVRKVFIDTIPNIMFF
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE2 HVRPLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQQWQRQGLVAAALEKLE
. :: . : : :.. . :.. . :
CCDS22 STMKRPSREKQDKK-----------IFT-EDIDI----SDIS----GKPG----------
350 360 370
420 430 440 450 460 470
pF1KE2 KGPELGLSQFCGSLKQAAPAIQACVEACNLIACARHQQSHFDNGNEEWFLVGRVLDRVCF
: .: : . : . : ... .:. . :: . ..... .:. :: :. :.:.. .
CCDS22 -PPPMG---FHSPLIKH-PEVKSAIEGIKYIAETMKSDQESNNAAAEWKYVAMVMDHILL
380 390 400 410 420 430
480 490 500 510
pF1KE2 LAMLSLFICGTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
... . : :: ..:
CCDS22 GVFMLVCIIGTLAVFAGRLIELNQQG
440 450
>>CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 (502 aa)
initn: 961 init1: 569 opt: 662 Z-score: 811.1 bits: 159.6 E(32554): 7.4e-39
Smith-Waterman score: 1126; 41.1% identity (66.5% similar) in 514 aa overlap (6-505:6-491)
10 20 30 40 50
pF1KE2 MHGGQGPLLLLL---LLAVCLGAQGRNQEERLLADLMQ--NYDPNLRPAERDSDVVNVSL
::. ::: :: .: :. : . ::::. :.. :. .::: :..:.:.:
CCDS10 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSELVTVQL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 KLTLTNLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWRPDIVLE
..:..:::..:::. .:::::. ..: :::: : :...... .:.:: .: ::.::
CCDS10 MVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLPDVVLY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 NNVDGVFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQSQTYST
::.::..::..: :..:: :: :.::::::..:::.: : .:::: :::.. :.: ::.
CCDS10 NNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRSWTYDR
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 NEIDLQLSQEDGQTIEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGHQKVVFYL
.:::: :..: .. . :: .::: : :.. .: ... . ... .
CCDS10 TEIDLVLKSEVASL--------DDFTPSGEWDIVALPGRRNENP----DDSTYVDITYDF
190 200 210 220
240 250 260 270 280 290
pF1KE2 LIQRKPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLFLVAKKV
.:.::::::.::.: :::::.:.:::. .::. : .: :. :.:::: ::::.:..: :
CCDS10 IIRRKPLFYTINLIIPCVLITSLAILVFYLPSDCG-EKMTLCISVLLALTVFLLLISKIV
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE2 PETSQAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLRLLPQLL
: :: :::..::: : .:.. . .:..: :::: ::: ::.:: :. :::. :: ::
CCDS10 PPTSLDVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALL
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE2 RMHVRPLAPAAVQDTQ-SRLQNGSSGWSITTGEEVALCLPRSELLFQQWQRQGLVAA--A
:. .: : : . : : : . .: : . .. . :::..: :
CCDS10 FMQ-QPRHHCARQRLRLRRRQREREGAGALFFRE-APGADSCTCFVNRASVQGLAGAFGA
350 360 370 380 390 400
420 430 440 450 460
pF1KE2 LEKLEKGPELGLS-QFCG-SLKQAAPAIQACVEACNLIACARHQQSHFDNGN--EEWFLV
:: : : . :: .:..: :.. .:: :..:. :. . :.: :
CCDS10 EPAPVAGP--GRSGEPCGCGLREA-------VDGVRFIA--DHMRSEDDDQSVSEDWKYV
410 420 430 440 450
470 480 490 500 510
pF1KE2 GRVLDRVCFLAMLSLFIC--GTAGIFLMAHYNRVPALPFPGDPRPYLPSPD
. :.::. :: .. .:.: :: :.::. .. . :
CCDS10 AMVIDRL-FLWIF-VFVCVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK
460 470 480 490 500
>>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa)
initn: 998 init1: 562 opt: 594 Z-score: 726.1 bits: 144.2 E(32554): 4e-34
Smith-Waterman score: 970; 42.4% identity (69.4% similar) in 382 aa overlap (3-374:4-371)
10 20 30 40
pF1KE2 MHGGQG------PLLLLL---LLAVCLGAQGRNQ-EERLLADLMQNYDPNLRPAERDSD
:: : :::::: :: . .. : . ::::: :...:. ::. ::
CCDS13 MELGGPGAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANISD
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 VVNVSLKLTLTNLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVWR
:: : . :....::...:... .:::::....: ::.::::: :::.. .:.:: ..::
CCDS13 VVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIWR
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE2 PDIVLENNVDGVFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIFQ
::::: ::.:: : :. .. . :: . : ::::..:.:::.::.:::: :::.. :
CCDS13 PDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKFG
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE2 SQTYSTNEIDLQLSQEDGQTIEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGHQ
: ::. .::: ..... .: : :.:::.: . . : .
CCDS13 SWTYDKAKIDL-VNMHSR-------VDQLDFWESGEWVIVDAVGTYNTRKYECCAEI-YP
190 200 210 220 230
230 240 250 260 270 280
pF1KE2 KVVFYLLIQRKPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFLF
... ..:.: ::::.::.: ::.::: ...:. .::.. : .: :. :.:::. ::::.
CCDS13 DITYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECG-EKITLCISVLLSLTVFLL
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 LVAKKVPETSQAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFLR
:... .: :: ..:::..:: : .. . : .: .: :::: :::.::.: ::.:::
CCDS13 LITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLD
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 LLPQLLRMHVRPLAPAAVQDTQSRLQNGSSGWSITTGEEVALCLPRSELLFQQWQRQGLV
..:.:: :. :..:.:. ::
CCDS13 IVPRLLLMK----RPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSP
360 370 380 390 400
>>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa)
initn: 937 init1: 544 opt: 572 Z-score: 700.1 bits: 139.2 E(32554): 1.1e-32
Smith-Waterman score: 980; 36.5% identity (64.1% similar) in 488 aa overlap (19-493:52-521)
10 20 30 40
pF1KE2 MHGGQGPLLLLLLLAVCLGAQGRNQEERLLADLMQNYDPNLRPAERDS
:.. . :.::. :...:. ::. :
CCDS60 TPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARPVPNTS
30 40 50 60 70 80
50 60 70 80 90 100
pF1KE2 DVVNVSLKLTLTNLISLNEREEALTTNVWIEMQWCDYRLRWDPRDYEGLWVLRVPSTMVW
::: : . :....::...:... .:::::....: ::.:::.: :. .. ::::: :.:
CCDS60 DVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSEMIW
90 100 110 120 130 140
110 120 130 140 150 160
pF1KE2 RPDIVLENNVDGVFEVALYCNVLVSPDGCIYWLPPAIFRSACSISVTYFPFDWQNCSLIF
::::: ::.:: : :. . .. . : ..:.::::..:.:::.::.:::: :::.. :
CCDS60 IPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCKMKF
150 160 170 180 190 200
170 180 190 200 210 220
pF1KE2 QSQTYSTNEIDLQLSQEDGQTIEWIFIDPEAFTENGEWAIQHRPAKMLLDPAAPAQEAGH
: ::. .:::. . ::. : . . :.::::: . . . : .
CCDS60 GSWTYDKAKIDLEQME---QTV-----DLKDYWESGEWAIVNATGTYNSKKYDCCAEI-Y
210 220 230 240 250
230 240 250 260 270 280
pF1KE2 QKVVFYLLIQRKPLFYVINIIAPCVLISSVAILIHFLPAKAGGQKCTVAINVLLAQTVFL
:.. ..:.: ::::.::.: ::.::: ...:. .::. : .: :. :.:::. ::::
CCDS60 PDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCG-EKITLCISVLLSLTVFL
260 270 280 290 300 310
290 300 310 320 330 340
pF1KE2 FLVAKKVPETSQAVPLISKYLTFLLVVTILIVVNAVVVLNVSLRSPHTHSMARGVRKVFL
.:... .: :: ..:::..:: : .. . : .: .: :::: ::: ::.: . :: ..:
CCDS60 LLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALL
320 330 340 350 360 370
350 360 370 380 390 400
pF1KE2 RLLPQLLRMHVRPLAPAAVQDTQSRLQNGSSGW--SITTGEEVALCLPRSELLFQQWQRQ
.:. : :. :: :. . . : : : . .:: . . . . .:
CCDS60 GCVPRWLLMN-RPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEED----RWACA
380 390 400 410 420
410 420 430 440 450
pF1KE2 GLVAAALEKL---------EKGPELGLSQFCGSLKQAAPAIQACVEACNLIACARHQQSH
: :: .. : .::. : : .: .: .:. . :: ....
CCDS60 GHVAPSVGTLCSHGHLHSGASGPKAEALLQEGEL-LLSPHMQKALEGVHYIADHLRSEDA
430 440 450 460 470 480
460 470 480 490 500 510
pF1KE2 FDNGNEEWFLVGRVLDRVCFLAMLSLFIC--GTAGIFLMAHYNRVPALPFPGDPRPYLPS
.. .:.: :. :.::. :: .. ...: :: :.::
CCDS60 DSSVKEDWKYVAMVIDRI-FLWLF-IIVCFLGTIGLFLPPFLAGMI
490 500 510 520
pF1KE2 PD
517 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 09:24:26 2016 done: Sun Nov 6 09:24:27 2016
Total Scan time: 3.390 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]