FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0845, 1026 aa
1>>>pF1KSDA0845 1026 - 1026 aa - 1026 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 18.7553+/-0.00153; mu= -40.3028+/- 0.092
mean_var=770.1205+/-159.037, 0's: 0 Z-trim(113.4): 185 B-trim: 0 in 0/53
Lambda= 0.046216
statistics sampled from 13884 (14046) to 13884 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.691), E-opt: 0.2 (0.431), width: 16
Scan time: 5.430
The best scores are: opt bits E(32554)
CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 6420 444.1 6.9e-124
CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 1699 129.3 3.6e-29
CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 1120 90.6 8.8e-18
CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 1015 83.6 1.2e-15
CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 964 80.2 1.1e-14
CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 938 78.5 3.8e-14
CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 881 74.6 4.9e-13
CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 869 73.8 8.5e-13
CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 869 73.8 8.6e-13
CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 863 73.5 1.2e-12
>>CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020 aa)
initn: 7437 init1: 4449 opt: 6420 Z-score: 2337.7 bits: 444.1 E(32554): 6.9e-124
Smith-Waterman score: 6420; 99.4% identity (99.4% similar) in 1026 aa overlap (1-1026:1-1020)
10 20 30 40 50 60
pF1KSD MMSFGGADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSVSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MMSFGGADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSVSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD SPSRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SPSRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD HNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD VRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD LLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD SEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD QEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SLPEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SLPEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD EEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEAKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEAKS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD PAEVKSPEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPAEAKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PAEVKSPEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPAEAKS
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD PEKAKSPVKEEAKSPAEAKSPVKEEAKSPAEVKSPEKAKSPTKEEAKSPEKAKSPEKAKS
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PEKAKSPVKEEAKSPAEAKSPVKEEAKSPAEVKSPEKAKSPTKEEAKSPEKAKSPEK---
610 620 630 640 650
670 680 690 700 710 720
pF1KSD PEKEEAKSPEKAKSPVKAEAKSPEKAKSPVKAEAKSPEKAKSPVKEEAKSPEKAKSPVKE
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ---EEAKSPEKAKSPVKAEAKSPEKAKSPVKAEAKSPEKAKSPVKEEAKSPEKAKSPVKE
660 670 680 690 700 710
730 740 750 760 770 780
pF1KSD EAKSPEKAKSPVKEEAKTPEKAKSPVKEEAKSPEKAKSPEKAKTLDVKSPEAKTPAKEEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EAKSPEKAKSPVKEEAKTPEKAKSPVKEEAKSPEKAKSPEKAKTLDVKSPEAKTPAKEEA
720 730 740 750 760 770
790 800 810 820 830 840
pF1KSD RSPADKFPEKAKSPVKEEVKSPEKAKSPLKEDAKAPEKEIPKKEEVKSPVKEEEKPQEVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 RSPADKFPEKAKSPVKEEVKSPEKAKSPLKEDAKAPEKEIPKKEEVKSPVKEEEKPQEVK
780 790 800 810 820 830
850 860 870 880 890 900
pF1KSD VKEPPKKAEEEKAPATPKTEEKKDSKKEEAPKKEAPKPKVEEKKEPAVEKPKESKVEAKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VKEPPKKAEEEKAPATPKTEEKKDSKKEEAPKKEAPKPKVEEKKEPAVEKPKESKVEAKK
840 850 860 870 880 890
910 920 930 940 950 960
pF1KSD EEAEDKKKVPTPEKEAPAKVEVKEDAKPKEKTEVAKKEPDDAKAKEPSKPAEKKEAAPEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EEAEDKKKVPTPEKEAPAKVEVKEDAKPKEKTEVAKKEPDDAKAKEPSKPAEKKEAAPEK
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KSD KDTKEEKAKKPEEKPKTEAKAKEDDKTLSKEPSKPKAEKAEKSSSTDQKDSKPPEKATED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KDTKEEKAKKPEEKPKTEAKAKEDDKTLSKEPSKPKAEKAEKSSSTDQKDSKPPEKATED
960 970 980 990 1000 1010
pF1KSD KAAKGK
::::::
CCDS13 KAAKGK
1020
>>CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 (916 aa)
initn: 1017 init1: 803 opt: 1699 Z-score: 637.2 bits: 129.3 E(32554): 3.6e-29
Smith-Waterman score: 1800; 41.8% identity (65.3% similar) in 979 aa overlap (37-983:25-911)
10 20 30 40 50 60
pF1KSD ADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGF--HSWTRTSVSSVSASPSR
.: ... :::: .::.: : :.::.: .:
CCDS60 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSPSSGFRSQSWSRGSPSTVSSSYKR
10 20 30 40 50
70 80 90 100 110
pF1KSD --------FRGAGAASSTDSLD-----TLSNGPEGCMVAVATSRS-EKEQLQALNDRFAG
. .: .:. .::: .: :: : ::: ::::::.:::::::
CCDS60 SMLAPRLAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD YIDKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLE
::.::. :: .:. .:.: ::::.::... .:. :..:.::.:... .. ..:..:.
CCDS60 YIEKVHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLD
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD QEHLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYL
..:: ::: ....:...::: :...::: ::: . .:: ..:.:.::.:.::.: ..:
CCDS60 SDHLEEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFL
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD RRHHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSE
: .:.:::..::.:::.: .. .: .: :: :...::.:::.:::.:. :. :.:
CCDS60 RSNHEEEVADLLAQIQAS-----HITVERKDYLKTDISTALKEIRSQLESHSDQNMHQAE
240 250 260 270 280
300 310 320 330 340 350
pF1KSD EWFRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELE
:::. : .:.:::. : .:.:::.:::.:::::::... :::....::.::::: :..:
CCDS60 EWFKCRYAKLTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIE
290 300 310 320 330 340
360 370 380 390 400 410
pF1KSD DRHQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEE
.::. :..:::..::::. :::.:::::: .:::::::::::::::::::::::::::::
CCDS60 ERHNHDLSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEE
350 360 370 380 390 400
420 430 440 450 460
pF1KSD CRIGF--GPIPFSLPEGLPKIPSVSTHI-KVKSEE-KIKVVEKSEKETVIVEEQTEETQV
:.. : : : : : ..:..: : : : :.:: .: .::: :::.:
CCDS60 TRFSTFAGSITGPLYTHRPPI-TISSKIQKPKVEAPKLKVQHK------FVEEIIEETKV
410 420 430 440 450 460
470 480 490 500 510 520
pF1KSD TEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKS
.: .: :: . : . . .::. :..::. . : ::: : ::::: :
CCDS60 EDEKSEMEEALTAITE-ELAVSMKEEKKEAAEEKEEEPEAEEEEVAAK--KSPVKATAPE
470 480 490 500 510
530 540 550 560 570 580
pF1KSD PAEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKS
: .. ..:: . : . : ::: ::. : :..: ::::..
CCDS60 VKEEEGEKEEEEGQEEEEEEDEGAKSDQAEEGGSEKEGSS-EKEEGE-------------
520 530 540 550 560
590 600 610 620 630 640
pF1KSD PAKEEAKSPAEAKSPEKAKSPVKEEAKSPAEAKSPVKEEAKSPAEVKSPEKAKSPTKEEA
.::... :::.. : :::: :: : .: :: : : ::::
CCDS60 --QEEGETEAEAEGEE-------------AEAK----EEKK--VEEKSEEVA---TKEEL
570 580 590 600
650 660 670 680 690 700
pF1KSD KSPEKAKSPEKAKSPEKEEAKSPEKAKSPVKAEAKSPEKAKSPVKAEAKSPEKAKSPVKE
. :...::::::: : ::::. ..::: ::::. ..::: ::::.:
CCDS60 VADAKVEKPEKAKSP------VP---KSPVEEKGKSPVP-KSPVEEKGKSPVP-KSPVEE
610 620 630 640 650
710 720 730 740 750 760
pF1KSD EAKSPEKAKSPVKEEAKSPEKAKSPVKEEAKTPEKAKSPVKEEAKSPEKAKSPEKAKTLD
..::: ::::.:..::: .::::.:.::.: :::: ::::: .. . :. .
CCDS60 KGKSPVP-KSPVEEKGKSPV-SKSPVEEKAKSPVP-KSPV-EEAKSKAEVGKGEQKEE--
660 670 680 690 700
770 780 790 800 810 820
pF1KSD VKSPEAKTPAKEEARSPADKFPEKAKSPVKEEVKSPEKAKSPLKEDAKAPEKEIPK--KE
. :.: ::: : .: ..: ..: .::.::.::.: : : : :
CCDS60 -EEKEVKEAPKEE------KVEKKEEKP--KDVPEKKKAESPVKEEAVAEVVTITKSVKV
710 720 730 740 750
830 840 850 860 870 880
pF1KSD EVKSPVKEEEKPQEVKVKEPPKKAEEEKAPATPKTEEKKDSKKEEAPKKE--APKPKVEE
.... .::: :: . .. :.::: . .::. ..: .. .:: : . .::
CCDS60 HLEKETKEEGKPLQ-------QEKEKEKAGGEGGSEEEGSDKGAKGSRKEDIAVNGEVEG
760 770 780 790 800
890 900 910 920 930
pF1KSD KKEPAVEKPKESKVEAKKEEAEDKKKVPTPEKEAPAKVEVKEDAKPKEKTEVAK------
:.: ::. . : ...:: : : . .:: : : : .::. :.:
CCDS60 KEE--VEQETKEKGSGREEE---KGVVTNGLDLSPAD-EKKGGDKSEEKVVVTKTVEKIT
810 820 830 840 850 860
940 950 960 970 980 990
pF1KSD KEPDDAKAKEPSKPAEKKEAAPEKKDTKEEK--AKKPEEKPKTEAKAKEDDKTLSKEPSK
.: :. .: .: . . . :...: ::: . : :: ..: .::
CCDS60 SEGGDGATKYITKSVTVTQKVEEHEETFEEKLVSTKKVEKVTSHAIVKEVTQSD
870 880 890 900 910
1000 1010 1020
pF1KSD PKAEKAEKSSSTDQKDSKPPEKATEDKAAKGK
>>CCDS7545.1 INA gene_id:9118|Hs108|chr10 (499 aa)
initn: 737 init1: 592 opt: 1120 Z-score: 432.7 bits: 90.6 E(32554): 8.8e-18
Smith-Waterman score: 1130; 44.5% identity (70.9% similar) in 501 aa overlap (2-482:1-485)
10 20 30 40 50
pF1KSD MMSFGGADALLGAP-FAPLHGGGS-LHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSV
::::. : .. . . : :: : :. ::::: :: .: .:..:.:
CCDS75 MSFGSEHYLCSSSSYRKVFGDGSRLSARLSGAGGAGGFRS--------QSLSRSNVASS
10 20 30 40 50
60 70 80 90 100 110
pF1KSD SA-SPSRFRGAGAA----SSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYID
.: : . : : : ..:.:: ::.. .::::::.:::::: .:.
CCDS75 AACSSASSLGLGLAYRRPPASDGLD-LSQAAARTNEYKIIRTNEKEQLQGLNDRFAVFIE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD KVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEH
::.:::..::.::.: :::::..: : .:::..::.:..:. . . ..::.: ::..
CCDS75 KVHQLETQNRALEAELAALRQRHAEPSRVGELFQRELRDLRAQLEEASSARSQALLERDG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD LLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRH
: :.. ..: : ..:.: :: :: : .: : .. : ::.::.::...: .: ...:.
CCDS75 LAEEVQRLRARCEEESRGREGAERALKAQQRDVDGATLARLDLEKKVESLLDELAFVRQV
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD HQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWF
:.:::.:::. .:.:. : :.... . : :.:::::::::: :. :... ..:::.
CCDS75 HDEEVAELLATLQASSQAAAEVDVTVA---KPDLTSALREIRAQYESLAAKNLQSAEEWY
240 250 260 270 280
300 310 320 330 340 350
pF1KSD RVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRH
. .. :.: : .:.:.:...::: :::::::::: :.:.:.....::::: :::.::
CCDS75 KSKFANLNEQAARSTEAIRASREEIHEYRRQLQARTIEIEGLRGANESLERQILELEERH
290 300 310 320 330 340
360 370 380 390 400 410
pF1KSD QADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRI
.:..:.::..: ::. .::::: ::: .::::::::::::::::::::::::::::: :.
CCDS75 SAEVAGYQDSIGQLENDLRNTKSEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRF
350 360 370 380 390 400
420 430 440 450 460
pF1KSD --------GFGPIP---FSLPEGLPKIPSVSTHIKVKSEE-KIKVVEKSEKETVIVEEQT
:..:.: . :: :.: :..: ::.: ..: :. :. . .. ..:
CCDS75 STSGLSISGLNPLPNPSYLLP---PRILSATTS-KVSSTGLSLKKEEEEEEASKVASKKT
410 420 430 440 450 460
470 480 490 500 510 520
pF1KSD EET-QVTEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPV
. . ::. :: .:. :
CCDS75 SQIGESFEEILEETVISTKKTEKSNIEETTISSQKI
470 480 490
>>CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 (543 aa)
initn: 915 init1: 583 opt: 1015 Z-score: 394.3 bits: 83.6 E(32554): 1.2e-15
Smith-Waterman score: 1015; 39.3% identity (67.9% similar) in 521 aa overlap (45-557:31-536)
20 30 40 50 60 70
pF1KSD FAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSVSASPSR---FRGAGAA
::. : .:.. :: :: : : . ..
CCDS75 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGY-STARSAYSSYSAPVSSSLSVRRSYSS
10 20 30 40 50
80 90 100 110 120
pF1KSD SSTDSLDTLSNGPEGCMVAVATS----RS-EKEQLQALNDRFAGYIDKVRQLEAHNRSLE
:: . . .: : . ..:.... :. :: ::: ::::::..:..:..:: .:. ::
CCDS75 SSGSLMPSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQNKVLE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KSD GEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVRQRLD
.: .:::... : . :::.:.:..: :. . :. :.: : : . ... : .
CCDS75 AELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETLRNLQARYE
120 130 140 150 160 170
190 200 210 220 230 240
pF1KSD DEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELLGQIQ
.:. .::.::. . :.:: ::..:.:. ..:..: ..:.. :.::..:: .:::
CCDS75 EEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAELQAQIQ
180 190 200 210 220 230
250 260 270 280 290 300
pF1KSD GSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSEAAKV
::...: :. : :...::..:::: : :... ..::::. :. :.:.:
CCDS75 -----YAQISVEM-DVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTESAAK
240 250 260 270 280 290
310 320 330 340 350 360
pF1KSD NTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQEAIQQ
::::.:.:..:..: :: :.:.: :.:: .. ...::.: .::::...:::...:..:..
CCDS75 NTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDTINK
300 310 320 330 340 350
370 380 390 400 410 420
pF1KSD LDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSLPEGL
:. :::.:: ::: :.::::::::::::::::::::::::::: :..: . :. :
CCDS75 LENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVG-SITSGY
360 370 380 390 400 410
430 440 450 460 470 480
pF1KSD PKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKEEEGKEE
. .: . . . . . .... ...: :. :: :: . :: ::.:.:
CCDS75 SQSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQI--EV-EETIEAAKAEEAKDE
420 430 440 450 460
490 500 510 520 530 540
pF1KSD EGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEAKSPAEVKS
.: : : ::. : :: :. :.:: . .:::: : .. : ::.. :..
CCDS75 PPSEGEAEE--EEKDKEEAEEEEAAEEEEAAKEESEEAKE--EEEGGEGEEGEETKEAEE
470 480 490 500 510 520
550 560 570 580 590 600
pF1KSD PEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPAEAKSPEKAKS
:: : ::
CCDS75 EEKKVEGAGEEQAAKKKD
530 540
>>CCDS7120.1 VIM gene_id:7431|Hs108|chr10 (466 aa)
initn: 849 init1: 539 opt: 964 Z-score: 376.9 bits: 80.2 E(32554): 1.1e-14
Smith-Waterman score: 973; 41.1% identity (72.3% similar) in 455 aa overlap (10-455:14-455)
10 20 30 40 50
pF1KSD MMSFGGADALLGAPFAPLHGGGSLHYAL-ARKGGAGGTRSAAGSSSGFHSWTRTSV
..:.: . . ..: :. . . . :. ..: .... . .:
CCDS71 MSTRSVSSSSYRRMFGGPGTASRPSSSRSYVTTSTRTYSLGSALRPSTSRSLYASSPGGV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD SSVSASPSRFRGA--GAASSTDSLD-TLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYI
.. .: :.:.. :. ::.: .:... . . : .:: .:: ::::::.::
CCDS71 YATRSSAVRLRSSVPGVRLLQDSVDFSLADAINTEFKN--TRTNEKVELQELNDRFANYI
70 80 90 100 110
120 130 140 150 160 170
pF1KSD DKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQE
:::: :: .:. : .: :. : :.: .:.:::.:.::.: : .: ......:..
CCDS71 DKVRFLEQQNKILLAELEQLKGQ--GKSRLGDLYEEEMRELRRQVDQLTNDKARVEVERD
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD HLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRR
.: ::: ..:..:..: :::::: . ... . ...: ::.::..:...:::: ..:..
CCDS71 NLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEIAFLKK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD HHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEW
:.::. :: .::: . ..: .. :. : :.:.:::..: : :. :... ..:::
CCDS71 LHEEEIQELQAQIQ-----EQHVQIDV-DVSKPDLTAALRDVRQQYESVAAKNLQEAEEW
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD FRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDR
.. .. :::::. :.::.:.:..: ::::::.:. : :..:::.:..::::: :.:.
CCDS71 YKSKFADLSEAANRNNDALRQAKQESTEYRRQVQSLTCEVDALKGTNESLERQMREMEEN
300 310 320 330 340 350
360 370 380 390 400 410
pF1KSD HQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECR
.. :.::..: .:. :..: : ::: .:::::::::::::::::::.::::::::: :
CCDS71 FAVEAANYQDTIGRLQDEIQNMKEEMARHLREYQDLLNVKMALDIEIATYRKLLEGEESR
360 370 380 390 400 410
420 430 440 450 460
pF1KSD IGFGPIP-FS---LPE-GLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVT
:.. :.: :: : : .: ..: :.:: : ::.:: . ...
CCDS71 ISL-PLPNFSSLNLRETNLDSLPLVDTH--SKRTLLIKTVETRDGQVINETSQHHDDLE
420 430 440 450 460
470 480 490 500 510 520
pF1KSD EEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSP
>>CCDS33383.1 DES gene_id:1674|Hs108|chr2 (470 aa)
initn: 959 init1: 520 opt: 938 Z-score: 367.5 bits: 78.5 E(32554): 3.8e-14
Smith-Waterman score: 953; 39.2% identity (69.4% similar) in 477 aa overlap (3-470:17-469)
10 20 30 40
pF1KSD MMSFGGADAL-LGAPFA----PLHGGGSLHYALARKGGAGGTRSAA
.:::: .. ::.:.. : : :: . . . . . ..
CCDS33 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTS
10 20 30 40 50 60
50 60 70 80 90 100
pF1KSD GSSSGFHSWTRTSVSSVSASPSRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQL
:...:. : :.: ... .:: . ::: . . :.... ..: .:: .:
CCDS33 GGAGGLGS-LRASRLGTTRTPSSY-GAGELLDFSLADAVNQE------FLTTRTNEKVEL
70 80 90 100 110
110 120 130 140 150 160
pF1KSD QALNDRFAGYIDKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLG
: ::::::.::.::: :: .: .: .:. :. .. : : ::::.:.::.: : :
CCDS33 QELNDRFANYIEKVRFLEQQNAALAAEVNRLKGREPTRVA--ELYEEELRELRRQVEVLT
120 130 140 150 160 170
170 180 190 200 210 220
pF1KSD AARGQLRLEQEHLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQ
:... .:...::.:. ... .:..: . .:::: :. .. : ::.::... .
CCDS33 NQRARVDVERDNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIE
180 190 200 210 220 230
230 240 250 260 270 280
pF1KSD ALQEECGYLRRHHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGH
.:.:: ..:.. :.::. :: .:.: . :.:.: : : :.:.:::.:::: :
CCDS33 SLNEEIAFLKKVHEEEIRELQAQLQ-----EQQVQVEM-DMSKPDLTAALRDIRAQYETI
240 250 260 270 280
290 300 310 320 330 340
pF1KSD AVQSTLQSEEWFRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDS
:... ..:::.. ... :..::. :.::.:.:..:. :::.:.:. : :..:::.:.::
CCDS33 AAKNISEAEEWYKSKVSDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDS
290 300 310 320 330 340
350 360 370 380 390 400
pF1KSD LERQRSELEDRHQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAA
: :: ::::: .. ..::. : .:. :.:. : ::: .:::::::::::::::.:::.
CCDS33 LMRQMRELEDRFASEASGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIAT
350 360 370 380 390 400
410 420 430 440 450
pF1KSD YRKLLEGEECRIGFGPIP----FSLPEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIV
::::::::: ::.. :: ... : :. . ......:. ::..: . :.:
CCDS33 YRKLLEGEESRINL-PIQTYSALNFRETSPE--QRGSEVHTKKTVMIKTIETRDGEVV--
410 420 430 440 450
460 470 480 490 500 510
pF1KSD EEQTEETQVTEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAK
.: :: .::
CCDS33 ---SEATQQQHEVL
460 470
>>CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 (432 aa)
initn: 831 init1: 513 opt: 881 Z-score: 347.5 bits: 74.6 E(32554): 4.9e-13
Smith-Waterman score: 881; 43.7% identity (71.7% similar) in 375 aa overlap (93-463:65-427)
70 80 90 100 110 120
pF1KSD SRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEAHN
: ::. ... ::::::.::.::: :: .:
CCDS11 TRLSLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQN
40 50 60 70 80 90
130 140 150 160 170 180
pF1KSD RSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVR
..: .: :: .. . ....:. :.::.: . .: : ..:..:...: .:.: ::
CCDS11 KALAAELNQLRAKEPTK--LADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVR
100 110 120 130 140 150
190 200 210 220 230 240
pF1KSD QRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELL
:.:.::. : ::: : . :.:: ::.::..: ..:.:: .::. :.::: ::
CCDS11 QKLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQ
160 170 180 190 200 210
250 260 270 280 290 300
pF1KSD GQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSE
:. :. :...: :. : :.:.::.:::.: :. : .. ..:::.: .. :..
CCDS11 EQL-----ARQQVHVEL-DVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTD
220 230 240 250 260
310 320 330 340 350 360
pF1KSD AAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQE
:: :.. .:.:..: ..::::::. : .::.:..:..::::: : :.:: . :::::
CCDS11 AAARNAELLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQE
270 280 290 300 310 320
370 380 390 400 410 420
pF1KSD AIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSL
:. .:. : .. : ::: .:.:::::::::.:::::::.::::::::: :: :: .
CCDS11 ALARLEEEGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRI---TIPVQT
330 340 350 360 370 380
430 440 450 460 470
pF1KSD PEGLPKIPSVSTHIKVKSEEKIK---VVEKSE-KETVIVEEQTEETQVTEEVTEEEEKEA
.: .: .: : :: ..: ::. : .. ...:. .:
CCDS11 FSNL-QIRETSLDTKSVSEGHLKRNIVVKTVEMRDGEVIKESKQEHKDVM
390 400 410 420 430
480 490 500 510 520 530
pF1KSD KEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEA
>>CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 (431 aa)
initn: 831 init1: 513 opt: 869 Z-score: 343.2 bits: 73.8 E(32554): 8.5e-13
Smith-Waterman score: 869; 46.2% identity (74.2% similar) in 329 aa overlap (93-421:65-385)
70 80 90 100 110 120
pF1KSD SRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEAHN
: ::. ... ::::::.::.::: :: .:
CCDS45 TRLSLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQN
40 50 60 70 80 90
130 140 150 160 170 180
pF1KSD RSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVR
..: .: :: .. . ....:. :.::.: . .: : ..:..:...: .:.: ::
CCDS45 KALAAELNQLRAKEPTK--LADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVR
100 110 120 130 140 150
190 200 210 220 230 240
pF1KSD QRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELL
:.:.::. : ::: : . :.:: ::.::..: ..:.:: .::. :.::: ::
CCDS45 QKLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQ
160 170 180 190 200 210
250 260 270 280 290 300
pF1KSD GQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSE
:. :. :...: :. : :.:.::.:::.: :. : .. ..:::.: .. :..
CCDS45 EQL-----ARQQVHVEL-DVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTD
220 230 240 250 260
310 320 330 340 350 360
pF1KSD AAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQE
:: :.. .:.:..: ..::::::. : .::.:..:..::::: : :.:: . :::::
CCDS45 AAARNAELLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQE
270 280 290 300 310 320
370 380 390 400 410 420
pF1KSD AIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSL
:. .:. : .. : ::: .:.:::::::::.:::::::.::::::::: :: . ::
CCDS45 ALARLEEEGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSN
330 340 350 360 370 380
430 440 450 460 470 480
pF1KSD PEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKEEE
CCDS45 LQIRGGKSTKDGENHKVTRYLKSLTIRVIPIQAHQIVNGTPPARG
390 400 410 420 430
>>CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 (438 aa)
initn: 831 init1: 513 opt: 869 Z-score: 343.1 bits: 73.8 E(32554): 8.6e-13
Smith-Waterman score: 869; 46.2% identity (74.2% similar) in 329 aa overlap (93-421:65-385)
70 80 90 100 110 120
pF1KSD SRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEAHN
: ::. ... ::::::.::.::: :: .:
CCDS59 TRLSLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQN
40 50 60 70 80 90
130 140 150 160 170 180
pF1KSD RSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVR
..: .: :: .. . ....:. :.::.: . .: : ..:..:...: .:.: ::
CCDS59 KALAAELNQLRAKEPTK--LADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVR
100 110 120 130 140 150
190 200 210 220 230 240
pF1KSD QRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELL
:.:.::. : ::: : . :.:: ::.::..: ..:.:: .::. :.::: ::
CCDS59 QKLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQ
160 170 180 190 200 210
250 260 270 280 290 300
pF1KSD GQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSE
:. :. :...: :. : :.:.::.:::.: :. : .. ..:::.: .. :..
CCDS59 EQL-----ARQQVHVEL-DVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTD
220 230 240 250 260
310 320 330 340 350 360
pF1KSD AAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQE
:: :.. .:.:..: ..::::::. : .::.:..:..::::: : :.:: . :::::
CCDS59 AAARNAELLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQE
270 280 290 300 310 320
370 380 390 400 410 420
pF1KSD AIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSL
:. .:. : .. : ::: .:.:::::::::.:::::::.::::::::: :: . ::
CCDS59 ALARLEEEGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSN
330 340 350 360 370 380
430 440 450 460 470 480
pF1KSD PEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKEEE
CCDS59 LQIRGQYSRASWEGHWSPAPSSRACRLLQTGTEDQGKGIQLSLGAFVTLQRS
390 400 410 420 430
>>CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 (470 aa)
initn: 816 init1: 490 opt: 863 Z-score: 340.5 bits: 73.5 E(32554): 1.2e-12
Smith-Waterman score: 863; 38.6% identity (68.3% similar) in 448 aa overlap (35-463:22-458)
10 20 30 40 50 60
pF1KSD GGADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSV--SASP
: : . .. .. : .: : : . ::::
CCDS87 MSHHPSGLRAGFSSTSYRRTFGPPPSLSPGAFSYSSSSRFSSSRLLGSASP
10 20 30 40 50
70 80 90 100 110
pF1KSD SR------FR----GAGAASSTDS--LDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAG
: :: :::: : :: .: . . .:: .::..:: ::::::.
CCDS87 SSSVRLGSFRSPRAGAGALLRLPSERLD-FSMAEALNQEFLATRSNEKQELQELNDRFAN
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD YIDKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLE
.:.::: :: .: .:.:: . : :. .:. .: ..:.::.: . :: : ....:
CCDS87 FIEKVRFLEQQNAALRGELSQARGQEPARA--DQLCQQELRELRRELELLGRERDRVQVE
120 130 140 150 160
180 190 200 210 220 230
pF1KSD QEHLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYL
.. : ::.: ..:::..:.:.::.:: . . ...: .:..:..: ..:..: .:
CCDS87 RDGLAEDLAALKQRLEEETRKREDAEHNLVLFRKDVDDATLSRLELERKIESLMDEIEFL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KSD RRHHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSE
.. :.::. .: : : .: .:.:.. ..: ..:.:::.:::: :. :... ..:
CCDS87 KKLHEEELRDL----QVSVESQQVQQVEVEATVKPELTAALRDIRAQYESIAAKNLQEAE
230 240 250 260 270 280
300 310 320 330 340 350
pF1KSD EWFRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELE
::.. . ::.::. : .:.:.:..:..: :::.:. : :...:..:...: :: :::
CCDS87 EWYKSKYADLSDAANRNHEALRQAKQEMNESRRQIQSLTCEVDGLRGTNEALLRQLRELE
290 300 310 320 330 340
360 370 380 390 400 410
pF1KSD DRHQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEE
.. . ..:: . .:. :::. : ::: .:::::.:::::::::::::.:::::::::
CCDS87 EQFALEAGGYQAGAARLEEELRQLKEEMARHLREYQELLNVKMALDIEIATYRKLLEGEE
350 360 370 380 390 400
420 430 440 450 460
pF1KSD CRIGFGPI----PFSLPEGLPKI-PSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQ
::. :. ... .:.. : ..: .. ::..: . : :..: : :.
CCDS87 SRISV-PVHSFASLNIKTTVPEVEPPQDSH--SRKTVLIKTIETRNGE-VVTESQKEQRS
410 420 430 440 450 460
470 480 490 500 510 520
pF1KSD VTEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAK
CCDS87 ELDKSSAHSY
470
1026 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 03:42:43 2016 done: Thu Nov 3 03:42:44 2016
Total Scan time: 5.430 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]