FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4240, 471 aa
1>>>pF1KB4240 471 - 471 aa - 471 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.5930+/-0.000995; mu= -10.1737+/- 0.060
mean_var=311.9079+/-63.071, 0's: 0 Z-trim(115.1): 19 B-trim: 0 in 0/52
Lambda= 0.072621
statistics sampled from 15663 (15678) to 15663 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.771), E-opt: 0.2 (0.482), width: 16
Scan time: 3.610
The best scores are: opt bits E(32554)
CCDS2385.1 MAP2 gene_id:4133|Hs108|chr2 ( 471) 3051 332.9 4.5e-91
CCDS2384.1 MAP2 gene_id:4133|Hs108|chr2 (1827) 2072 230.6 1.1e-59
CCDS33369.1 MAP2 gene_id:4133|Hs108|chr2 ( 559) 1371 156.9 5e-38
CCDS56033.1 MAPT gene_id:4137|Hs108|chr17 ( 410) 943 112.0 1.2e-24
CCDS11502.1 MAPT gene_id:4137|Hs108|chr17 ( 352) 930 110.6 2.7e-24
CCDS11499.1 MAPT gene_id:4137|Hs108|chr17 ( 441) 857 103.0 6.6e-22
CCDS45715.1 MAPT gene_id:4137|Hs108|chr17 ( 776) 851 102.5 1.6e-21
CCDS45716.1 MAPT gene_id:4137|Hs108|chr17 ( 412) 841 101.3 2e-21
CCDS11500.1 MAPT gene_id:4137|Hs108|chr17 ( 383) 837 100.9 2.5e-21
CCDS11501.1 MAPT gene_id:4137|Hs108|chr17 ( 758) 839 101.2 3.9e-21
CCDS46818.1 MAP4 gene_id:4134|Hs108|chr3 (1135) 536 69.6 2e-11
>>CCDS2385.1 MAP2 gene_id:4133|Hs108|chr2 (471 aa)
initn: 3051 init1: 3051 opt: 3051 Z-score: 1748.6 bits: 332.9 E(32554): 4.5e-91
Smith-Waterman score: 3051; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:1-471)
10 20 30 40 50 60
pF1KB4 MADERKDEAKAPHWTSAPLTEASAHSHPPEIKDQGGAGEGLVRSANGFPYREDEEGAFGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 MADERKDEAKAPHWTSAPLTEASAHSHPPEIKDQGGAGEGLVRSANGFPYREDEEGAFGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 HGSQGTYSNTKENGINGELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 HGSQGTYSNTKENGINGELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 AALPLAAEETANLPPSPPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVSDGVTKSPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 AALPLAAEETANLPPSPPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVSDGVTKSPE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 KRSSLPRPSSILPPRRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPTTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 KRSSLPRPSSILPPRRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPTTP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 GSTAITPGTPPSYSSRTPGTPGTPSYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 GSTAITPGTPPSYSSRTPGTPGTPSYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPAT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 PKQLRLINQPLPDLKNVKSKIGSTDNIKYQPKGGQVQIVTKKIDLSHVTSKCGSLKNIRH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 PKQLRLINQPLPDLKNVKSKIGSTDNIKYQPKGGQVQIVTKKIDLSHVTSKCGSLKNIRH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 RPGGGRVKIESVKLDFKEKAQAKVGSLDNAHHVPGGGNVKIDSQKLNFREHAKARVDHGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 RPGGGRVKIESVKLDFKEKAQAKVGSLDNAHHVPGGGNVKIDSQKLNFREHAKARVDHGA
370 380 390 400 410 420
430 440 450 460 470
pF1KB4 EIITQSPGRSSVASPRRLSNVSSSGSINLLESPQLATLAEDVTAALAKQGL
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 EIITQSPGRSSVASPRRLSNVSSSGSINLLESPQLATLAEDVTAALAKQGL
430 440 450 460 470
>>CCDS2384.1 MAP2 gene_id:4133|Hs108|chr2 (1827 aa)
initn: 3037 init1: 2069 opt: 2072 Z-score: 1185.4 bits: 230.6 E(32554): 1.1e-59
Smith-Waterman score: 2072; 80.1% identity (87.7% similar) in 422 aa overlap (54-471:1410-1827)
30 40 50 60 70 80
pF1KB4 AHSHPPEIKDQGGAGEGLVRSANGFPYREDEEGAFGEHGSQGTYSNTKENGIN---GELT
:: : : .. .. ::. .. :...
CCDS23 DSIMDADSLWVDTQDDDRSIMTEQLETIPKEEKAEKEARRSSLEKHRKEKPFKTGRGRIS
1380 1390 1400 1410 1420 1430
90 100 110 120 130 140
pF1KB4 SADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQTAALPLAAEETANLPPSPPPS
. .:..:.. . . . . . :: : . . :.. . : : ... :
CCDS23 TPERKVAKKEPSTVSRDEVRRKKAVYK--KAELAKKTEVQAHSP--SRKFILKPAIKYTR
1440 1450 1460 1470 1480 1490
150 160 170 180 190
pF1KB4 PASEQTVTVEE-AAGGESALAPSVFKQAKDKVSDGVTKSPEKRSSLPRPSSILPPRRGVS
:. . : . ::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 PTHLSCVKRKTTAAGGESALAPSVFKQAKDKVSDGVTKSPEKRSSLPRPSSILPPRRGVS
1500 1510 1520 1530 1540 1550
200 210 220 230 240 250
pF1KB4 GDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPTTPGSTAITPGTPPSYSSRTPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 GDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPTTPGSTAITPGTPPSYSSRTPG
1560 1570 1580 1590 1600 1610
260 270 280 290 300 310
pF1KB4 TPGTPSYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPATPKQLRLINQPLPDLKNVKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 TPGTPSYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPATPKQLRLINQPLPDLKNVKS
1620 1630 1640 1650 1660 1670
320 330 340 350 360 370
pF1KB4 KIGSTDNIKYQPKGGQVQIVTKKIDLSHVTSKCGSLKNIRHRPGGGRVKIESVKLDFKEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 KIGSTDNIKYQPKGGQVQIVTKKIDLSHVTSKCGSLKNIRHRPGGGRVKIESVKLDFKEK
1680 1690 1700 1710 1720 1730
380 390 400 410 420 430
pF1KB4 AQAKVGSLDNAHHVPGGGNVKIDSQKLNFREHAKARVDHGAEIITQSPGRSSVASPRRLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 AQAKVGSLDNAHHVPGGGNVKIDSQKLNFREHAKARVDHGAEIITQSPGRSSVASPRRLS
1740 1750 1760 1770 1780 1790
440 450 460 470
pF1KB4 NVSSSGSINLLESPQLATLAEDVTAALAKQGL
::::::::::::::::::::::::::::::::
CCDS23 NVSSSGSINLLESPQLATLAEDVTAALAKQGL
1800 1810 1820
>--
initn: 1038 init1: 982 opt: 1003 Z-score: 580.1 bits: 118.6 E(32554): 5.4e-26
Smith-Waterman score: 1017; 56.7% identity (71.3% similar) in 335 aa overlap (1-316:1-331)
10 20 30 40 50 60
pF1KB4 MADERKDEAKAPHWTSAPLTEASAHSHPPEIKDQGGAGEGLVRSANGFPYREDEEGAFGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 MADERKDEAKAPHWTSAPLTEASAHSHPPEIKDQGGAGEGLVRSANGFPYREDEEGAFGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 HGSQGTYSNTKENGINGELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 HGSQGTYSNTKENGINGELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQT
70 80 90 100 110 120
130 140 150 160 170
pF1KB4 AALPLAAEETANLPPSPPPSPASEQTVTVEE----AAGGE----SALAPSVFKQA--KDK
::::::::::::::::::::::::::::::: :. : . :.::. . . :.:
CCDS23 AALPLAAEETANLPPSPPPSPASEQTVTVEEDLLTASKMEFHDQQELTPSTAEPSDQKEK
130 140 150 160 170 180
180 190 200 210 220
pF1KB4 VSDGVTKSPE--KRSSL---PRPSSILPPRRGVSGDRDENS-FSL--NSSISSSARRTTR
:. .: : :...: :. .. : .. ..: ..:.. ..: .. ..: .
CCDS23 ESEKQSKPGEDLKHAALVSQPETTKTYPDKKDMQGTEEEKAPLALFGHTLVASLEDMKQK
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB4 SEP-IRRAGKSGTSTPTTPGSTAITPGTPPSYSSRTPGTPGTPSYPRTPHTPGTPKSAIL
.:: . : . . : :: :. ... .: : : :: :...
CCDS23 TEPSLVVPGIDLPKEPPTPKEQKDWFIEMPTEAKKDEWGLVAPISP-GPLTPMREKDVFD
250 260 270 280 290
290 300 310 320 330 340
pF1KB4 VPSEKKVAIIRTPPKSPATPKQLRLINQPLPDLKNVKSKIGSTDNIKYQPKGGQVQIVTK
. . . .: :: .. : :: .::
CCDS23 DIPKWEGKQFDSPMPSPFQGGSFTL---PLDVMKNEIVTETSPFAPAFLQPDDKKSLQQT
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB4 KIDLSHVTSKCGSLKNIRHRPGGGRVKIESVKLDFKEKAQAKVGSLDNAHHVPGGGNVKI
CCDS23 SGPATAKDSFKIEEPHEAKPDKMAEAPPSEAMTLPKDAHIPVVEEHVMGKVLEEEKEAIN
360 370 380 390 400 410
>>CCDS33369.1 MAP2 gene_id:4133|Hs108|chr2 (559 aa)
initn: 2141 init1: 1235 opt: 1371 Z-score: 796.2 bits: 156.9 E(32554): 5e-38
Smith-Waterman score: 2685; 83.5% identity (83.5% similar) in 534 aa overlap (26-471:26-559)
10 20 30 40 50 60
pF1KB4 MADERKDEAKAPHWTSAPLTEASAHSHPPEIKDQGGAGEGLVRSANGFPYREDEEGAFGE
:::::::::::::::::::::::::::::::::::
CCDS33 MADERKDEAKAPHWTSAPLTEASAHSHPPEIKDQGGAGEGLVRSANGFPYREDEEGAFGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 HGSQGTYSNTKENGINGELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HGSQGTYSNTKENGINGELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQT
70 80 90 100 110 120
130 140 150 160 170
pF1KB4 AALPLAAEETANLPPSPPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVS--------
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AALPLAAEETANLPPSPPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVSNSTLSKIP
130 140 150 160 170 180
180
pF1KB4 -------------------------------------------------DGVTKSPEKRS
:::::::::::
CCDS33 ALQGSTKSPRYSSACPSTTKRATFSDSLLIQPTSAGSTDRLPYSKSGNKDGVTKSPEKRS
190 200 210 220 230 240
190 200 210 220 230 240
pF1KB4 SLPRPSSILPPRRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPTTPGST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SLPRPSSILPPRRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPTTPGST
250 260 270 280 290 300
250 260 270 280 290 300
pF1KB4 AITPGTPPSYSSRTPGTPGTPSYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPATPKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AITPGTPPSYSSRTPGTPGTPSYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPATPKQ
310 320 330 340 350 360
310 320 330
pF1KB4 LRLINQPLPDLKNVKSKIGSTDNIKYQPKGGQV---------------------------
:::::::::::::::::::::::::::::::::
CCDS33 LRLINQPLPDLKNVKSKIGSTDNIKYQPKGGQVRILNKKIDFSKVQSRCGSKDNIKHSAG
370 380 390 400 410 420
340 350 360 370 380 390
pF1KB4 ----QIVTKKIDLSHVTSKCGSLKNIRHRPGGGRVKIESVKLDFKEKAQAKVGSLDNAHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GGNVQIVTKKIDLSHVTSKCGSLKNIRHRPGGGRVKIESVKLDFKEKAQAKVGSLDNAHH
430 440 450 460 470 480
400 410 420 430 440 450
pF1KB4 VPGGGNVKIDSQKLNFREHAKARVDHGAEIITQSPGRSSVASPRRLSNVSSSGSINLLES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VPGGGNVKIDSQKLNFREHAKARVDHGAEIITQSPGRSSVASPRRLSNVSSSGSINLLES
490 500 510 520 530 540
460 470
pF1KB4 PQLATLAEDVTAALAKQGL
:::::::::::::::::::
CCDS33 PQLATLAEDVTAALAKQGL
550
>>CCDS56033.1 MAPT gene_id:4137|Hs108|chr17 (410 aa)
initn: 837 init1: 760 opt: 943 Z-score: 555.9 bits: 112.0 E(32554): 1.2e-24
Smith-Waterman score: 971; 41.6% identity (66.9% similar) in 450 aa overlap (31-471:11-410)
10 20 30 40 50
pF1KB4 MADERKDEAKAPHWTSAPLTEASAHSHPPEIKDQGGA-GEGLVRSANGFPYREDEEGAFG
..:..:. : : .. .:. ...:.::
CCDS56 MAEPRQEFEVMEDHAGTYGLGDRKDQGGYTMHQDQEGDTD
10 20 30 40
60 70 80 90 100 110
pF1KB4 EHGSQGTYSNTKENGINGELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQ
... .. :.: .: .. ::.. :. .. ::: : .: :.: . .
CCDS56 AGLKESPLQTPTEDG--SEEPGS--ETSDAKSTPTAEDVTAPLVD--EGAPGKQAAAQPH
50 60 70 80 90
120 130 140 150 160 170
pF1KB4 TAALPLAAEETANLPPSPPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVS--DGVTK
: .. : :.. .: ..:. :.:. . : : : .:: .. : .:
CCDS56 TEIPEGTTAEEAGIGDTP----------SLEDEAAGHVTQARMVSK-SKDGTGSDDKKAK
100 110 120 130 140
180 190 200 210 220 230
pF1KB4 SPEKRSSLPRPSSILPPRRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTP
. . .... : . :: : .:. ....: ... : .:
CCDS56 GADGKTKIATPRGAAPP--GQKGQ------------ANATRIPAKTPP----------AP
150 160 170
240 250 260 270 280 290
pF1KB4 TTPGSTAITPGTPPSYSSRT----PGTPGTP-SYPRTPHTPGTPKSAILVPSEKKVAIIR
:: :. : ::. ..:. ::.:::: : ::: : : : ::::..:
CCDS56 KTPPSS----GEPPKSGDRSGYSSPGSPGTPGSRSRTPSLPTPPTRE---P--KKVAVVR
180 190 200 210 220 230
300 310 320 330 340 350
pF1KB4 TPPKSPATPK-QLRLINQPLPDLKNVKSKIGSTDNIKYQPKGGQVQIVTKKIDLSHVTSK
::::::.. : .:. :.:::::::::::::.:.:.:: ::.:::: : .:::.::::
CCDS56 TPPKSPSSAKSRLQTAPVPMPDLKNVKSKIGSTENLKHQPGGGKVQIVYKPVDLSKVTSK
240 250 260 270 280 290
360 370 380 390 400 410
pF1KB4 CGSLKNIRHRPGGGRVKIESVKLDFKEKAQAKVGSLDNAHHVPGGGNVKIDSQKLNFREH
:::: ::.:.::::.:...: :::::...:.:.::::: ::::::: ::...::.:::.
CCDS56 CGSLGNIHHKPGGGQVEVKSEKLDFKDRVQSKIGSLDNITHVPGGGNKKIETHKLTFREN
300 310 320 330 340 350
420 430 440 450 460 470
pF1KB4 AKARVDHGAEIITQSPGRSSVASPRRLSNVSSSGSINLLESPQLATLAEDVTAALAKQGL
:::..::::::. .:: :. .:::.::::::.:::....::::::::..:.:.::::::
CCDS56 AKAKTDHGAEIVYKSPVVSGDTSPRHLSNVSSTGSIDMVDSPQLATLADEVSASLAKQGL
360 370 380 390 400 410
>>CCDS11502.1 MAPT gene_id:4137|Hs108|chr17 (352 aa)
initn: 837 init1: 760 opt: 930 Z-score: 549.6 bits: 110.6 E(32554): 2.7e-24
Smith-Waterman score: 937; 45.9% identity (69.1% similar) in 375 aa overlap (107-471:23-352)
80 90 100 110 120 130
pF1KB4 GELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQTAALP--LAAEETANLP
. .: ..:.:: . : ::: :..
CCDS11 MAEPRQEFEVMEDHAGTYGLGDRKDQGGYTMHQDQEGDTDAGLKAEE-AGIG
10 20 30 40 50
140 150 160 170 180 190
pF1KB4 PSPPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVS--DGVTKSPEKRSSLPRPSSIL
.: ..:. :.:. . : : : .:: .. : .:. . .... : .
CCDS11 DTP----------SLEDEAAGHVTQARMVSK-SKDGTGSDDKKAKGADGKTKIATPRGAA
60 70 80 90 100
200 210 220 230 240 250
pF1KB4 PPRRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPTTPGSTAITPGTPPS
:: : .:. ....: ... : .: :: :. : ::.
CCDS11 PP--GQKGQ------------ANATRIPAKTPP----------APKTPPSS----GEPPK
110 120 130
260 270 280 290 300
pF1KB4 YSSRT----PGTPGTP-SYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPATPK-QLRL
..:. ::.:::: : ::: : : : ::::..:::::::.. : .:.
CCDS11 SGDRSGYSSPGSPGTPGSRSRTPSLPTPPTRE---P--KKVAVVRTPPKSPSSAKSRLQT
140 150 160 170 180
310 320 330 340 350 360
pF1KB4 INQPLPDLKNVKSKIGSTDNIKYQPKGGQVQIVTKKIDLSHVTSKCGSLKNIRHRPGGGR
:.:::::::::::::.:.:.:: ::.:::: : .:::.:::::::: ::.:.::::.
CCDS11 APVPMPDLKNVKSKIGSTENLKHQPGGGKVQIVYKPVDLSKVTSKCGSLGNIHHKPGGGQ
190 200 210 220 230 240
370 380 390 400 410 420
pF1KB4 VKIESVKLDFKEKAQAKVGSLDNAHHVPGGGNVKIDSQKLNFREHAKARVDHGAEIITQS
:...: :::::...:.:.::::: ::::::: ::...::.:::.:::..::::::. .:
CCDS11 VEVKSEKLDFKDRVQSKIGSLDNITHVPGGGNKKIETHKLTFRENAKAKTDHGAEIVYKS
250 260 270 280 290 300
430 440 450 460 470
pF1KB4 PGRSSVASPRRLSNVSSSGSINLLESPQLATLAEDVTAALAKQGL
: :. .:::.::::::.:::....::::::::..:.:.::::::
CCDS11 PVVSGDTSPRHLSNVSSTGSIDMVDSPQLATLADEVSASLAKQGL
310 320 330 340 350
>>CCDS11499.1 MAPT gene_id:4137|Hs108|chr17 (441 aa)
initn: 821 init1: 711 opt: 857 Z-score: 506.7 bits: 103.0 E(32554): 6.6e-22
Smith-Waterman score: 907; 38.9% identity (63.0% similar) in 481 aa overlap (31-471:11-441)
10 20 30 40 50
pF1KB4 MADERKDEAKAPHWTSAPLTEASAHSHPPEIKDQGGA-GEGLVRSANGFPYREDEEGAFG
..:..:. : : .. .:. ...:.::
CCDS11 MAEPRQEFEVMEDHAGTYGLGDRKDQGGYTMHQDQEGDTD
10 20 30 40
60 70 80 90 100 110
pF1KB4 EHGSQGTYSNTKENGINGELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQ
... .. :.: .: .. ::.. :. .. ::: : .: :.: . .
CCDS11 AGLKESPLQTPTEDG--SEEPGS--ETSDAKSTPTAEDVTAPLVD--EGAPGKQAAAQPH
50 60 70 80 90
120 130 140 150 160 170
pF1KB4 TAALPLAAEETANLPPSPPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVS--DGVTK
: .. : :.. .: ..:. :.:. . : : : .:: .. : .:
CCDS11 TEIPEGTTAEEAGIGDTP----------SLEDEAAGHVTQARMVSK-SKDGTGSDDKKAK
100 110 120 130 140
180 190 200 210 220 230
pF1KB4 SPEKRSSLPRPSSILPPRRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTP
. . .... : . :: : .:. ....: ... : .:
CCDS11 GADGKTKIATPRGAAPP--GQKGQ------------ANATRIPAKTPP----------AP
150 160 170
240 250 260 270 280 290
pF1KB4 TTPGSTAITPGTPPSYSSRT----PGTPGTP-SYPRTPHTPGTPKSAILVPSEKKVAIIR
:: :. : ::. ..:. ::.:::: : ::: : : : ::::..:
CCDS11 KTPPSS----GEPPKSGDRSGYSSPGSPGTPGSRSRTPSLPTPPTRE---P--KKVAVVR
180 190 200 210 220 230
300 310 320 330 340
pF1KB4 TPPKSPATPK-QLRLINQPLPDLKNVKSKIGSTDNIKYQPKGGQVQIVTKK---------
::::::.. : .:. :.:::::::::::::.:.:.:: ::.:::..::
CCDS11 TPPKSPSSAKSRLQTAPVPMPDLKNVKSKIGSTENLKHQPGGGKVQIINKKLDLSNVQSK
240 250 260 270 280 290
350 360 370 380
pF1KB4 ----------------------IDLSHVTSKCGSLKNIRHRPGGGRVKIESVKLDFKEKA
.:::.:::::::: ::.:.::::.:...: :::::...
CCDS11 CGSKDNIKHVPGGGSVQIVYKPVDLSKVTSKCGSLGNIHHKPGGGQVEVKSEKLDFKDRV
300 310 320 330 340 350
390 400 410 420 430 440
pF1KB4 QAKVGSLDNAHHVPGGGNVKIDSQKLNFREHAKARVDHGAEIITQSPGRSSVASPRRLSN
:.:.::::: ::::::: ::...::.:::.:::..::::::. .:: :. .:::.:::
CCDS11 QSKIGSLDNITHVPGGGNKKIETHKLTFRENAKAKTDHGAEIVYKSPVVSGDTSPRHLSN
360 370 380 390 400 410
450 460 470
pF1KB4 VSSSGSINLLESPQLATLAEDVTAALAKQGL
:::.:::....::::::::..:.:.::::::
CCDS11 VSSTGSIDMVDSPQLATLADEVSASLAKQGL
420 430 440
>>CCDS45715.1 MAPT gene_id:4137|Hs108|chr17 (776 aa)
initn: 805 init1: 711 opt: 851 Z-score: 499.6 bits: 102.5 E(32554): 1.6e-21
Smith-Waterman score: 913; 37.8% identity (60.5% similar) in 511 aa overlap (17-471:297-776)
10 20 30 40
pF1KB4 MADERKDEAKAPHWTSAPLTEASAHSH-PPEI-KDQGGAGEGLVRS
::: : . : . :.. :.:. . : : :.
CCDS45 LPVDFLSKVSTEIPASEPDGPSVGRAKGQDAPL-EFTFHVEITPNVQKEQAHSEEHLGRA
270 280 290 300 310 320
50 60 70 80 90
pF1KB4 A-NGFPYREDE-EG-AFGEHGSQGTYSNTKENGINGELTSADRETAEEVSARIV------
: : : . : .: ..:: ... . .:. . . . ...::.:
CCDS45 AFPGAPGEGPEARGPSLGEDTKEADLPEPSEKQPAAAPRGKPVSRVPQLKARMVSKSKDG
330 340 350 360 370 380
100 110 120 130 140
pF1KB4 --------QVVTAEAVAVLKGEQEKEAQHKDQTAALPLAAEETANLPPSPPPSPASEQTV
.. : .. .::.. .: .. :: . . : :: :: ..:
CCDS45 TGSDDKKAKTSTRSSAKTLKNRPCLSPKHPTPGSSDPLIQPSSPAVCPEPPSSPKYVSSV
390 400 410 420 430 440
150 160 170 180 190 200
pF1KB4 TVEEAAGGESALAPSVFKQAKDKVSDGVTKSPEKRSSLPRPSSILPPRRGVSGDRDENSF
: . ...: :. : : .:: :: . : . :: : .:. . . .
CCDS45 TSRTGSSGA--------KEMKLKGADGKTK-------IATPRGAAPP--GQKGQANATRI
450 460 470 480
210 220 230 240 250 260
pF1KB4 SLNSSISSSARRTTRSEPIRRAGKSGTSTPTTPGSTAITPGTPPSYSSRT----PGTPGT
.. . .. .. .. ..: :. : : : ::. ..:. ::.:::
CCDS45 PAKTPPAPKTPPSSATKQVQR-----RPPPAGPRSER---GEPPKSGDRSGYSSPGSPGT
490 500 510 520 530 540
270 280 290 300 310 320
pF1KB4 P-SYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPATPK-QLRLINQPLPDLKNVKSKI
: : ::: : : : ::::..:::::::.. : .:. :.::::::::::
CCDS45 PGSRSRTPSLPTPPTRE---P--KKVAVVRTPPKSPSSAKSRLQTAPVPMPDLKNVKSKI
550 560 570 580 590
330 340 350
pF1KB4 GSTDNIKYQPKGGQVQIVTKK-------------------------------IDLSHVTS
:::.:.:.:: ::.:::..:: .:::.:::
CCDS45 GSTENLKHQPGGGKVQIINKKLDLSNVQSKCGSKDNIKHVPGGGSVQIVYKPVDLSKVTS
600 610 620 630 640 650
360 370 380 390 400 410
pF1KB4 KCGSLKNIRHRPGGGRVKIESVKLDFKEKAQAKVGSLDNAHHVPGGGNVKIDSQKLNFRE
::::: ::.:.::::.:...: :::::...:.:.::::: ::::::: ::...::.:::
CCDS45 KCGSLGNIHHKPGGGQVEVKSEKLDFKDRVQSKIGSLDNITHVPGGGNKKIETHKLTFRE
660 670 680 690 700 710
420 430 440 450 460 470
pF1KB4 HAKARVDHGAEIITQSPGRSSVASPRRLSNVSSSGSINLLESPQLATLAEDVTAALAKQG
.:::..::::::. .:: :. .:::.::::::.:::....::::::::..:.:.:::::
CCDS45 NAKAKTDHGAEIVYKSPVVSGDTSPRHLSNVSSTGSIDMVDSPQLATLADEVSASLAKQG
720 730 740 750 760 770
pF1KB4 L
:
CCDS45 L
>>CCDS45716.1 MAPT gene_id:4137|Hs108|chr17 (412 aa)
initn: 770 init1: 711 opt: 841 Z-score: 498.1 bits: 101.3 E(32554): 2e-21
Smith-Waterman score: 897; 41.5% identity (66.1% similar) in 407 aa overlap (107-471:23-412)
80 90 100 110 120 130
pF1KB4 GELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQTAALPLAAEETANLPPS
. .: ..:.:: . . :.: :
CCDS45 MAEPRQEFEVMEDHAGTYGLGDRKDQGGYTMHQDQEG------DTDAGLKES
10 20 30 40
140 150 160 170 180 190
pF1KB4 PPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVSDGVTKSPEKRSS--LPRPSSILPP
: .:. . . : :.:.. : :. .... : : : : ... . . .
CCDS45 PLQTPTEDGS----EEPGSETSDAKSTPTAEAEEAGIGDTPSLEDEAAGHVTQARMVSKS
50 60 70 80 90 100
200 210 220 230 240 250
pF1KB4 RRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPT-TPGSTAITP--GTPP
. : .:. :... . ... . .. : . . : ... ..: :. :: . : : ::
CCDS45 KDG-TGSDDKKAKGADGKTKIATPRGA-APPGQKGQANATRIPAKTPPAPKTPPSSGEPP
110 120 130 140 150 160
260 270 280 290 300
pF1KB4 SYSSRT----PGTPGTP-SYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPATPK-QLR
. ..:. ::.:::: : ::: : : : ::::..:::::::.. : .:.
CCDS45 KSGDRSGYSSPGSPGTPGSRSRTPSLPTPPTRE---P--KKVAVVRTPPKSPSSAKSRLQ
170 180 190 200 210
310 320 330 340
pF1KB4 LINQPLPDLKNVKSKIGSTDNIKYQPKGGQVQIVTKK-----------------------
:.:::::::::::::.:.:.:: ::.:::..::
CCDS45 TAPVPMPDLKNVKSKIGSTENLKHQPGGGKVQIINKKLDLSNVQSKCGSKDNIKHVPGGG
220 230 240 250 260 270
350 360 370 380 390
pF1KB4 --------IDLSHVTSKCGSLKNIRHRPGGGRVKIESVKLDFKEKAQAKVGSLDNAHHVP
.:::.:::::::: ::.:.::::.:...: :::::...:.:.::::: :::
CCDS45 SVQIVYKPVDLSKVTSKCGSLGNIHHKPGGGQVEVKSEKLDFKDRVQSKIGSLDNITHVP
280 290 300 310 320 330
400 410 420 430 440 450
pF1KB4 GGGNVKIDSQKLNFREHAKARVDHGAEIITQSPGRSSVASPRRLSNVSSSGSINLLESPQ
:::: ::...::.:::.:::..::::::. .:: :. .:::.::::::.:::....:::
CCDS45 GGGNKKIETHKLTFRENAKAKTDHGAEIVYKSPVVSGDTSPRHLSNVSSTGSIDMVDSPQ
340 350 360 370 380 390
460 470
pF1KB4 LATLAEDVTAALAKQGL
:::::..:.:.::::::
CCDS45 LATLADEVSASLAKQGL
400 410
>>CCDS11500.1 MAPT gene_id:4137|Hs108|chr17 (383 aa)
initn: 821 init1: 711 opt: 837 Z-score: 496.3 bits: 100.9 E(32554): 2.5e-21
Smith-Waterman score: 873; 42.4% identity (64.3% similar) in 406 aa overlap (107-471:23-383)
80 90 100 110 120 130
pF1KB4 GELTSADRETAEEVSARIVQVVTAEAVAVLKGEQEKEAQHKDQTAALP--LAAEETANLP
. .: ..:.:: . : ::: :..
CCDS11 MAEPRQEFEVMEDHAGTYGLGDRKDQGGYTMHQDQEGDTDAGLKAEE-AGIG
10 20 30 40 50
140 150 160 170 180 190
pF1KB4 PSPPPSPASEQTVTVEEAAGGESALAPSVFKQAKDKVS--DGVTKSPEKRSSLPRPSSIL
.: ..:. :.:. . : : : .:: .. : .:. . .... : .
CCDS11 DTP----------SLEDEAAGHVTQARMVSK-SKDGTGSDDKKAKGADGKTKIATPRGAA
60 70 80 90 100
200 210 220 230 240 250
pF1KB4 PPRRGVSGDRDENSFSLNSSISSSARRTTRSEPIRRAGKSGTSTPTTPGSTAITPGTPPS
:: : .:. ....: ... : .: :: :. : ::.
CCDS11 PP--GQKGQ------------ANATRIPAKTPP----------APKTPPSS----GEPPK
110 120 130
260 270 280 290 300
pF1KB4 YSSRT----PGTPGTP-SYPRTPHTPGTPKSAILVPSEKKVAIIRTPPKSPATPK-QLRL
..:. ::.:::: : ::: : : : ::::..:::::::.. : .:.
CCDS11 SGDRSGYSSPGSPGTPGSRSRTPSLPTPPTRE---P--KKVAVVRTPPKSPSSAKSRLQT
140 150 160 170 180
310 320 330 340
pF1KB4 INQPLPDLKNVKSKIGSTDNIKYQPKGGQVQIVTKK------------------------
:.:::::::::::::.:.:.:: ::.:::..::
CCDS11 APVPMPDLKNVKSKIGSTENLKHQPGGGKVQIINKKLDLSNVQSKCGSKDNIKHVPGGGS
190 200 210 220 230 240
350 360 370 380 390
pF1KB4 -------IDLSHVTSKCGSLKNIRHRPGGGRVKIESVKLDFKEKAQAKVGSLDNAHHVPG
.:::.:::::::: ::.:.::::.:...: :::::...:.:.::::: ::::
CCDS11 VQIVYKPVDLSKVTSKCGSLGNIHHKPGGGQVEVKSEKLDFKDRVQSKIGSLDNITHVPG
250 260 270 280 290 300
400 410 420 430 440 450
pF1KB4 GGNVKIDSQKLNFREHAKARVDHGAEIITQSPGRSSVASPRRLSNVSSSGSINLLESPQL
::: ::...::.:::.:::..::::::. .:: :. .:::.::::::.:::....::::
CCDS11 GGNKKIETHKLTFRENAKAKTDHGAEIVYKSPVVSGDTSPRHLSNVSSTGSIDMVDSPQL
310 320 330 340 350 360
460 470
pF1KB4 ATLAEDVTAALAKQGL
::::..:.:.::::::
CCDS11 ATLADEVSASLAKQGL
370 380
>>CCDS11501.1 MAPT gene_id:4137|Hs108|chr17 (758 aa)
initn: 821 init1: 711 opt: 839 Z-score: 493.0 bits: 101.2 E(32554): 3.9e-21
Smith-Waterman score: 899; 39.6% identity (61.0% similar) in 503 aa overlap (17-471:297-758)
10 20 30 40
pF1KB4 MADERKDEAKAPHWTSAPLTEASAHSH-PPEI-KDQGGAGEGLVRS
::: : . : . :.. :.:. . : : :.
CCDS11 LPVDFLSKVSTEIPASEPDGPSVGRAKGQDAPL-EFTFHVEITPNVQKEQAHSEEHLGRA
270 280 290 300 310 320
50 60 70 80 90 100
pF1KB4 ANGFPYREDEEGAFGEHGSQGTYSNTKENGINGELT--SADRETAEEVSARIVQVVTAEA
: :: :: :: : .. . :. ...: : . .: . . .: .:
CCDS11 A--FP------GAPGE-GPEARGPSLGEDTKEADLPEPSEKQPAAAPRGKPVSRVPQLKA
330 340 350 360 370
110 120 130 140 150 160
pF1KB4 VAVLKGEQEKEAQHKDQTAALPLAAEETANLPPSPP--PSPASEQTVTVEEAAGGESALA
: :... .. : .. .:. : : : :.:.: .. .
CCDS11 RMVSKSKDGTGSDDKKAKTSTRSSAKTLKNRPCLSPKHPTPGS-----------SDPLIQ
380 390 400 410 420
170 180 190 200 210 220
pF1KB4 PSVFKQAKDKVSDGVTKSPEKRSSLPRPSSILPPRRGVSGDRDENSFSLNSSISSSARRT
:: : .: :: :: :. : . : : :: .. ..:... ... :
CCDS11 PS---------SPAVC--PEPPSS-PKYVSSVTSRTGSSGAKE---MKLKGADGKTKIAT
430 440 450 460 470
230 240 250 260 270
pF1KB4 TR--SEPIRRAGKSGTSTPT-TPGSTAITP--GTPPSYSSRT----PGTPGTP-SYPRTP
: . : ... ..: :. :: . : : ::. ..:. ::.:::: : :::
CCDS11 PRGAAPPGQKGQANATRIPAKTPPAPKTPPSSGEPPKSGDRSGYSSPGSPGTPGSRSRTP
480 490 500 510 520 530
280 290 300 310 320
pF1KB4 HTPGTPKSAILVPSEKKVAIIRTPPKSPATPK-QLRLINQPLPDLKNVKSKIGSTDNIKY
: : : ::::..:::::::.. : .:. :.:::::::::::::.:.:.
CCDS11 SLPTPPTRE---P--KKVAVVRTPPKSPSSAKSRLQTAPVPMPDLKNVKSKIGSTENLKH
540 550 560 570 580
330 340 350
pF1KB4 QPKGGQVQIVTKK-------------------------------IDLSHVTSKCGSLKNI
:: ::.:::..:: .:::.:::::::: ::
CCDS11 QPGGGKVQIINKKLDLSNVQSKCGSKDNIKHVPGGGSVQIVYKPVDLSKVTSKCGSLGNI
590 600 610 620 630 640
360 370 380 390 400 410
pF1KB4 RHRPGGGRVKIESVKLDFKEKAQAKVGSLDNAHHVPGGGNVKIDSQKLNFREHAKARVDH
.:.::::.:...: :::::...:.:.::::: ::::::: ::...::.:::.:::..::
CCDS11 HHKPGGGQVEVKSEKLDFKDRVQSKIGSLDNITHVPGGGNKKIETHKLTFRENAKAKTDH
650 660 670 680 690 700
420 430 440 450 460 470
pF1KB4 GAEIITQSPGRSSVASPRRLSNVSSSGSINLLESPQLATLAEDVTAALAKQGL
::::. .:: :. .:::.::::::.:::....::::::::..:.:.::::::
CCDS11 GAEIVYKSPVVSGDTSPRHLSNVSSTGSIDMVDSPQLATLADEVSASLAKQGL
710 720 730 740 750
471 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 05:44:06 2016 done: Sat Nov 5 05:44:07 2016
Total Scan time: 3.610 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]