FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5285, 727 aa
1>>>pF1KB5285 727 - 727 aa - 727 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.0362+/-0.00101; mu= 6.2213+/- 0.061
mean_var=297.0005+/-61.542, 0's: 0 Z-trim(114.0): 875 B-trim: 0 in 0/54
Lambda= 0.074421
statistics sampled from 13576 (14546) to 13576 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.75), E-opt: 0.2 (0.447), width: 16
Scan time: 3.970
The best scores are: opt bits E(32554)
CCDS10841.1 CTCF gene_id:10664|Hs108|chr16 ( 727) 5025 553.5 4.2e-157
CCDS54029.1 CTCF gene_id:10664|Hs108|chr16 ( 399) 2819 316.3 5.6e-86
CCDS13459.1 CTCFL gene_id:140690|Hs108|chr20 ( 663) 1894 217.3 6.2e-56
CCDS58780.1 CTCFL gene_id:140690|Hs108|chr20 ( 700) 1894 217.3 6.5e-56
CCDS58781.1 CTCFL gene_id:140690|Hs108|chr20 ( 665) 1883 216.1 1.4e-55
CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20 ( 460) 1850 212.4 1.3e-54
CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20 ( 573) 1819 209.1 1.5e-53
CCDS68164.1 CTCFL gene_id:140690|Hs108|chr20 ( 627) 1819 209.2 1.6e-53
CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20 ( 422) 1786 205.4 1.4e-52
CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20 ( 403) 1766 203.3 6.1e-52
CCDS68161.1 CTCFL gene_id:140690|Hs108|chr20 ( 299) 1702 196.3 5.9e-50
CCDS58779.1 CTCFL gene_id:140690|Hs108|chr20 ( 613) 983 119.4 1.6e-26
CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 ( 717) 849 105.1 3.9e-22
CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16 ( 869) 839 104.1 9.4e-22
CCDS33093.2 ZNF28 gene_id:7576|Hs108|chr19 ( 718) 829 102.9 1.7e-21
CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19 ( 936) 827 102.9 2.4e-21
CCDS69562.1 ZNF34 gene_id:80778|Hs108|chr8 ( 539) 813 101.1 4.7e-21
CCDS12946.1 ZFP28 gene_id:140612|Hs108|chr19 ( 868) 817 101.7 4.8e-21
CCDS47945.1 ZNF34 gene_id:80778|Hs108|chr8 ( 560) 813 101.1 4.8e-21
CCDS13442.1 ZFP64 gene_id:55734|Hs108|chr20 ( 679) 813 101.2 5.5e-21
CCDS13440.1 ZFP64 gene_id:55734|Hs108|chr20 ( 681) 813 101.2 5.5e-21
CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19 ( 665) 809 100.8 7.3e-21
CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19 ( 667) 809 100.8 7.3e-21
CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19 ( 687) 809 100.8 7.5e-21
CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19 ( 692) 809 100.8 7.5e-21
CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 ( 715) 809 100.8 7.7e-21
CCDS75077.1 ZNF595 gene_id:152687|Hs108|chr4 ( 465) 798 99.4 1.3e-20
CCDS12854.1 ZNF83 gene_id:55769|Hs108|chr19 ( 516) 798 99.5 1.4e-20
CCDS75076.1 ZNF595 gene_id:152687|Hs108|chr4 ( 616) 798 99.5 1.6e-20
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 798 99.5 1.6e-20
CCDS56092.1 ZNF568 gene_id:374900|Hs108|chr19 ( 580) 797 99.4 1.6e-20
CCDS75075.1 ZNF595 gene_id:152687|Hs108|chr4 ( 648) 798 99.6 1.6e-20
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 798 99.6 1.6e-20
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 798 99.6 1.7e-20
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 798 99.6 1.7e-20
CCDS42558.1 ZNF568 gene_id:374900|Hs108|chr19 ( 644) 797 99.5 1.7e-20
CCDS74692.1 ZNF343 gene_id:79175|Hs108|chr20 ( 509) 789 98.5 2.7e-20
CCDS13028.1 ZNF343 gene_id:79175|Hs108|chr20 ( 599) 789 98.6 3e-20
CCDS74693.1 ZNF343 gene_id:79175|Hs108|chr20 ( 640) 789 98.6 3.2e-20
CCDS12972.1 ZNF329 gene_id:79673|Hs108|chr19 ( 541) 787 98.3 3.3e-20
CCDS54939.1 ZNF300 gene_id:91975|Hs108|chr5 ( 568) 782 97.8 4.9e-20
CCDS4311.2 ZNF300 gene_id:91975|Hs108|chr5 ( 604) 782 97.8 5.1e-20
CCDS54940.1 ZNF300 gene_id:91975|Hs108|chr5 ( 620) 782 97.8 5.2e-20
CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15 ( 614) 780 97.6 6e-20
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 783 98.2 6.9e-20
CCDS82391.1 ZNF160 gene_id:90338|Hs108|chr19 ( 782) 778 97.5 8.2e-20
CCDS12859.1 ZNF160 gene_id:90338|Hs108|chr19 ( 818) 778 97.5 8.4e-20
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 776 97.2 8.8e-20
CCDS46166.1 ZNF534 gene_id:147658|Hs108|chr19 ( 661) 771 96.7 1.2e-19
CCDS46165.1 ZNF534 gene_id:147658|Hs108|chr19 ( 674) 771 96.7 1.2e-19
>>CCDS10841.1 CTCF gene_id:10664|Hs108|chr16 (727 aa)
initn: 5025 init1: 5025 opt: 5025 Z-score: 2933.9 bits: 553.5 E(32554): 4.2e-157
Smith-Waterman score: 5025; 100.0% identity (100.0% similar) in 727 aa overlap (1-727:1-727)
10 20 30 40 50 60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQLVQVPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQLVQVPV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 PVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVKVGANGEVETLEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVKVGANGEVETLEQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 GELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTEEGKDVDVSVYDFEEEQQEGLLSEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTEEGKDVDVSVYDFEEEQQEGLLSEV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 NAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 NAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 RAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYAS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 VEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 TMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERY
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 ALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDM
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 HFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 HFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB5 KMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGRTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGRTN
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB5 QPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGEEEEAQPAATDAPNGDLTPEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGEEEEAQPAATDAPNGDLTPEM
670 680 690 700 710 720
pF1KB5 ILSMMDR
:::::::
CCDS10 ILSMMDR
>>CCDS54029.1 CTCF gene_id:10664|Hs108|chr16 (399 aa)
initn: 2819 init1: 2819 opt: 2819 Z-score: 1657.0 bits: 316.3 E(32554): 5.6e-86
Smith-Waterman score: 2819; 100.0% identity (100.0% similar) in 399 aa overlap (329-727:1-399)
300 310 320 330 340 350
pF1KB5 CGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDY
::::::::::::::::::::::::::::::
CCDS54 MAFVTSGELVRHRRYKHTHEKPFKCSMCDY
10 20 30
360 370 380 390 400 410
pF1KB5 ASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 ASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQ
40 50 60 70 80 90
420 430 440 450 460 470
pF1KB5 SGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHE
100 110 120 130 140 150
480 490 500 510 520 530
pF1KB5 RYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLL
160 170 180 190 200 210
540 550 560 570 580 590
pF1KB5 DMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 DMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGR
220 230 240 250 260 270
600 610 620 630 640 650
pF1KB5 KRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGR
280 290 300 310 320 330
660 670 680 690 700 710
pF1KB5 TNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGEEEEAQPAATDAPNGDLTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGEEEEAQPAATDAPNGDLTP
340 350 360 370 380 390
720
pF1KB5 EMILSMMDR
:::::::::
CCDS54 EMILSMMDR
>>CCDS13459.1 CTCFL gene_id:140690|Hs108|chr20 (663 aa)
initn: 1806 init1: 1806 opt: 1894 Z-score: 1117.6 bits: 217.3 E(32554): 6.2e-56
Smith-Waterman score: 1894; 47.4% identity (70.1% similar) in 639 aa overlap (13-631:10-618)
10 20 30 40 50 60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
:: : : :: . . .. .:.:. ... . .:. . .:..
CCDS13 MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
10 20 30 40 50
70 80 90 100 110
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
.. ..:. ..:.. .:: :. . :.:::.:.. . ... ...:
CCDS13 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
60 70 80 90 100
120 130 140 150 160
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
:: : : . . . :: ...: . .: . . : :. .:..
CCDS13 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
.. : : : :. . .:. : :..::. .: ..: : .:
CCDS13 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
170 180 190 200 210
230 240 250 260 270 280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
. :: . ::.... ....:::. : : . : ::.: ::.:..: .: : :.
CCDS13 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
220 230 240 250 260 270
290 300 310 320 330 340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS13 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
:::::::::::::::: :::::.::::::.::::::::::: :::::::::::::::::
CCDS13 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
:::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS13 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
.: :::::.::::::::::::::.::::::::: .:.:::.::::: : ::::::
CCDS13 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
::..: :.: :::::::. ::..::: ::.:... :::::: :.: .. ::...:..
CCDS13 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSG
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
.. . .: :..: ::::. :: .. ...: . . .: :.:
CCDS13 EAKSAASG----KGRRTRKRKQTILKEATKGQKEAAKGWKEAANGDEAAAEEASTTKGEQ
580 590 600 610 620
650 660 670 680 690 700
pF1KB5 VTPAPPPAKKRRGRPPGRTNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGE
CCDS13 FPGEMFPVACRETTARVKEEVDEGVTCEMLLNTMDK
630 640 650 660
>>CCDS58780.1 CTCFL gene_id:140690|Hs108|chr20 (700 aa)
initn: 1806 init1: 1806 opt: 1894 Z-score: 1117.3 bits: 217.3 E(32554): 6.5e-56
Smith-Waterman score: 1894; 47.4% identity (70.1% similar) in 639 aa overlap (13-631:10-618)
10 20 30 40 50 60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
:: : : :: . . .. .:.:. ... . .:. . .:..
CCDS58 MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
10 20 30 40 50
70 80 90 100 110
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
.. ..:. ..:.. .:: :. . :.:::.:.. . ... ...:
CCDS58 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
60 70 80 90 100
120 130 140 150 160
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
:: : : . . . :: ...: . .: . . : :. .:..
CCDS58 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
.. : : : :. . .:. : :..::. .: ..: : .:
CCDS58 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
170 180 190 200 210
230 240 250 260 270 280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
. :: . ::.... ....:::. : : . : ::.: ::.:..: .: : :.
CCDS58 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
220 230 240 250 260 270
290 300 310 320 330 340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS58 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
:::::::::::::::: :::::.::::::.::::::::::: :::::::::::::::::
CCDS58 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
:::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS58 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
.: :::::.::::::::::::::.::::::::: .:.:::.::::: : ::::::
CCDS58 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
::..: :.: :::::::. ::..::: ::.:... :::::: :.: .. ::...:..
CCDS58 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSG
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
.. . .: :..: ::::. :: .. ...: . . .: :.:
CCDS58 EAKSAASG----KGRRTRKRKQTILKEATKGQKEAAKGWKEAANGDEAAAEEASTTKGEQ
580 590 600 610 620
650 660 670 680 690 700
pF1KB5 VTPAPPPAKKRRGRPPGRTNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGE
CCDS58 FPGEMFPVACRETTARVKEEVDEGVTCEMLLNTMDNSAGCTGRMMLVSAWLLGRPQETYN
630 640 650 660 670 680
>>CCDS58781.1 CTCFL gene_id:140690|Hs108|chr20 (665 aa)
initn: 1806 init1: 1806 opt: 1883 Z-score: 1111.2 bits: 216.1 E(32554): 1.4e-55
Smith-Waterman score: 1883; 48.2% identity (70.8% similar) in 623 aa overlap (13-615:10-602)
10 20 30 40 50 60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
:: : : :: . . .. .:.:. ... . .:. . .:..
CCDS58 MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
10 20 30 40 50
70 80 90 100 110
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
.. ..:. ..:.. .:: :. . :.:::.:.. . ... ...:
CCDS58 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
60 70 80 90 100
120 130 140 150 160
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
:: : : . . . :: ...: . .: . . : :. .:..
CCDS58 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
.. : : : :. . .:. : :..::. .: ..: : .:
CCDS58 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
170 180 190 200 210
230 240 250 260 270 280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
. :: . ::.... ....:::. : : . : ::.: ::.:..: .: : :.
CCDS58 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
220 230 240 250 260 270
290 300 310 320 330 340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS58 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
:::::::::::::::: :::::.::::::.::::::::::: :::::::::::::::::
CCDS58 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
:::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS58 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
.: :::::.::::::::::::::.::::::::: .:.:::.::::: : ::::::
CCDS58 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
::..: :.: :::::::. ::..::: ::.:... :::::: :.: .. ::...:..
CCDS58 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSG
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
.. . .: :..: ::::. :: .. ...:
CCDS58 EAKSAASG----KGRRTRKRKQTILKEATKGQKEAAKGWKEAANGDGVISAHRNLCLLGS
580 590 600 610 620
650 660 670 680 690 700
pF1KB5 VTPAPPPAKKRRGRPPGRTNQPKQNQPTAIIQVEDQNTGAIENIIVEVKKEPDAEPAEGE
CCDS58 SDSHASVSGAGITDARHHAWLIVLLFLVEMGFYHVSHS
630 640 650 660
>>CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20 (460 aa)
initn: 1806 init1: 1806 opt: 1850 Z-score: 1094.0 bits: 212.4 E(32554): 1.3e-54
Smith-Waterman score: 1850; 64.9% identity (83.5% similar) in 393 aa overlap (223-615:14-397)
200 210 220 230 240 250
pF1KB5 KDPDYQPPAKKTKKTKKSKLRYTEEGKDVDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPP
:: . ::.... ....:::. :
CCDS68 MSGDERSDEIVLTVSNSNVEEQEDQPTAGQADAEKA----KST
10 20 30
260 270 280 290 300 310
pF1KB5 KPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCGRAFRTVTLLRNH
: . : ::.: ::.:..: .: : :...::::.::.:.:: :::: ..::::::::::
CCDS68 KNQR-KTKGAKGTFHCDVCMFTSSRMSSFNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNH
40 50 60 70 80 90
320 330 340 350 360 370
pF1KB5 LNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYASVEVSKLKRHIRS
.::::::::.:: ::.:::::::::::::::::::::::::::: :::::.::::::.::
CCDS68 VNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASVEASKLKRHVRS
100 110 120 130 140 150
380 390 400 410 420 430
pF1KB5 HTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSGTMKMHILQKHTE
::::::::: ::::::::::::::::::::::::::.:::.:::::::::.:::::: :
CCDS68 HTGERPFQCCQCSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQSGTMKIHILQKHGE
160 170 180 190 200 210
440 450 460 470 480 490
pF1KB5 NVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERYALIQHQKSHKNE
:: :..:::: :.::::::: ::.:. :.: :::::.::::::::::::::.::::
CCDS68 NVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHERYALIQHQKTHKNE
220 230 240 250 260 270
500 510 520 530 540 550
pF1KB5 KRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDMHFKRYHDPNFVP
::::: .:.:::.::::: : ::::::::..: :.: :::::::. ::..::: ::.:
CCDS68 KRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCFRQKQLLNAHFRKYHDANFIP
280 290 300 310 320 330
560 570 580 590 600 610
pF1KB5 AAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKRKMRSKKEDSSDS
... :::::: :.: .. ::...:.. .. . .: :..: ::::. :: .. .
CCDS68 TVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASG----KGRRTRKRKQTILKEATKGQ
340 350 360 370 380 390
620 630 640 650 660 670
pF1KB5 ENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGRTNQPKQNQPTAIIQ
..:
CCDS68 KEAAKGWKEAANGDGVISAHRNLCLLGSSDSHASVSGAGITDARHHAWLIVLLFLVEMGF
400 410 420 430 440 450
>>CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20 (573 aa)
initn: 2457 init1: 1761 opt: 1819 Z-score: 1074.9 bits: 209.1 E(32554): 1.5e-53
Smith-Waterman score: 1819; 50.0% identity (71.3% similar) in 574 aa overlap (13-566:10-557)
10 20 30 40 50 60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
:: : : :: . . .. .:.:. ... . .:. . .:..
CCDS58 MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
10 20 30 40 50
70 80 90 100 110
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
.. ..:. ..:.. .:: :. . :.:::.:.. . ... ...:
CCDS58 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
60 70 80 90 100
120 130 140 150 160
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
:: : : . . . :: ...: . .: . . : :. .:..
CCDS58 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
.. : : : :. . .:. : :..::. .: ..: : .:
CCDS58 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
170 180 190 200 210
230 240 250 260 270 280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
. :: . ::.... ....:::. : : . : ::.: ::.:..: .: : :.
CCDS58 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
220 230 240 250 260 270
290 300 310 320 330 340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS58 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
:::::::::::::::: :::::.::::::.::::::::::: :::::::::::::::::
CCDS58 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
:::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS58 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
.: :::::.::::::::::::::.::::::::: .:.:::.::::: : ::::::
CCDS58 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
::..: :.: :::::::. ::..::: ::.:... :::::: :.:
CCDS58 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWITSKWSGLKPQTF
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
CCDS58 IT
>>CCDS68164.1 CTCFL gene_id:140690|Hs108|chr20 (627 aa)
initn: 2457 init1: 1761 opt: 1819 Z-score: 1074.4 bits: 209.2 E(32554): 1.6e-53
Smith-Waterman score: 1819; 50.0% identity (71.3% similar) in 574 aa overlap (13-566:10-557)
10 20 30 40 50 60
pF1KB5 MEGDAVEAIVEESETFIKGKERKTYQRRREGGQEEDACHLPQNQTDGGEVVQDVNSSVQM
:: : : :: . . .. .:.:. ... . .:. . .:..
CCDS68 MAATEISVLSEQFTKIKELELMPEKGLKEEEKDGVCREKDHRSPSELEAERTSGA--
10 20 30 40 50
70 80 90 100 110
pF1KB5 VMMEQLDPTLLQMKTEVMEGTVAPEAEAAVDDTQIITLQVVNMEEQPINIGELQL-----
.. ..:. ..:.. .:: :. . :.:::.:.. . ... ...:
CCDS68 -----FQDSVLEEEVELV---LAPSEES---EKYILTLQTVHFTSEAVELQDMSLLSIQQ
60 70 80 90 100
120 130 140 150 160
pF1KB5 -------VQVPVPVTVPVATTSVEELQGAYENEVSKEGLAESEPMICHTLPLPEGFQVVK
:: : : . . . :: ...: . .: . . : :. .:..
CCDS68 QEGVQVVVQQPGPGLLWLEEGPRQSLQQCVAISIQQELYSPQEMEVLQFHALEENVMVAS
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB5 VGANGEVETLEQGELPPQEDPSWQKDPDYQPPAKKTKKTKKSKLRYTE-----EGKD---
.. : : : :. . .:. : :..::. .: ..: : .:
CCDS68 EDSKLAVSLAETTGLIKLEEEQ-EKN---QLLAERTKE----QLFFVETMSGDERSDEIV
170 180 190 200 210
230 240 250 260 270 280
pF1KB5 VDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSN
. :: . ::.... ....:::. : : . : ::.: ::.:..: .: : :.
CCDS68 LTVSNSNVEEQEDQPTAGQADAEKA----KSTKNQR-KTKGAKGTFHCDVCMFTSSRMSS
220 230 240 250 260 270
290 300 310 320 330 340
pF1KB5 LDRHMKSHTDERPHKCHLCGRAFRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRH
..::::.::.:.:: :::: ..::::::::::.::::::::.:: ::.::::::::::::
CCDS68 FNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRH
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB5 RRYKHTHEKPFKCSMCDYASVEVSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRT
:::::::::::::::: :::::.::::::.::::::::::: :::::::::::::::::
CCDS68 RRYKHTHEKPFKCSMCKYASVEASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRT
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB5 HSGEKPYECYICHARFTQSGTMKMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQH
:::::::::.:::.:::::::::.:::::: ::: :..:::: :.::::::: ::.:. :
CCDS68 HSGEKPYECHICHTRFTQSGTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLH
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB5 SYIEQGKKCRYCDAVFHERYALIQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGE
.: :::::.::::::::::::::.::::::::: .:.:::.::::: : ::::::
CCDS68 AYSAAELKCRYCSAVFHERYALIQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGE
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB5 KPYACSHCDKTFRQKQLLDMHFKRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGP
::..: :.: :::::::. ::..::: ::.:... :::::: :.:
CCDS68 KPFTCLSCNKCFRQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWILWVGNSEVAELG
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB5 DGVEGENGGETKKSKRGRKRKMRSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQP
CCDS68 GPGSGPLLRLQSGCPPGLHHPKAGLGPEDPLPGQLRHTTAGTGLSSLLQGPLCRAA
580 590 600 610 620
>>CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20 (422 aa)
initn: 2457 init1: 1761 opt: 1786 Z-score: 1057.3 bits: 205.4 E(32554): 1.4e-52
Smith-Waterman score: 1786; 70.3% identity (86.0% similar) in 344 aa overlap (223-566:14-352)
200 210 220 230 240 250
pF1KB5 KDPDYQPPAKKTKKTKKSKLRYTEEGKDVDVSVYDFEEEQQEGLLSEVNAEKVVGNMKPP
:: . ::.... ....:::. :
CCDS58 MSGDERSDEIVLTVSNSNVEEQEDQPTAGQADAEKA----KST
10 20 30
260 270 280 290 300 310
pF1KB5 KPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCGRAFRTVTLLRNH
: . : ::.: ::.:..: .: : :...::::.::.:.:: :::: ..::::::::::
CCDS58 KNQR-KTKGAKGTFHCDVCMFTSSRMSSFNRHMKTHTSEKPHLCHLCLKTFRTVTLLRNH
40 50 60 70 80 90
320 330 340 350 360 370
pF1KB5 LNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYASVEVSKLKRHIRS
.::::::::.:: ::.:::::::::::::::::::::::::::: :::::.::::::.::
CCDS58 VNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASVEASKLKRHVRS
100 110 120 130 140 150
380 390 400 410 420 430
pF1KB5 HTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSGTMKMHILQKHTE
::::::::: ::::::::::::::::::::::::::.:::.:::::::::.:::::: :
CCDS58 HTGERPFQCCQCSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQSGTMKIHILQKHGE
160 170 180 190 200 210
440 450 460 470 480 490
pF1KB5 NVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERYALIQHQKSHKNE
:: :..:::: :.::::::: ::.:. :.: :::::.::::::::::::::.::::
CCDS58 NVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHERYALIQHQKTHKNE
220 230 240 250 260 270
500 510 520 530 540 550
pF1KB5 KRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDMHFKRYHDPNFVP
::::: .:.:::.::::: : ::::::::..: :.: :::::::. ::..::: ::.:
CCDS58 KRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCFRQKQLLNAHFRKYHDANFIP
280 290 300 310 320 330
560 570 580 590 600 610
pF1KB5 AAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKRKMRSKKEDSSDS
... :::::: :.:
CCDS58 TVYKCSKCGKGFSRWILWVGNSEVAELGGPGSGPLLRLQSGCPPGLHHPKAGLGPEDPLP
340 350 360 370 380 390
>>CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20 (403 aa)
initn: 1742 init1: 1742 opt: 1766 Z-score: 1046.0 bits: 203.3 E(32554): 6.1e-52
Smith-Waterman score: 1766; 69.4% identity (86.3% similar) in 343 aa overlap (273-615:2-340)
250 260 270 280 290 300
pF1KB5 EKVVGNMKPPKPTKIKKKGVKKTFQCELCSYTCPRRSNLDRHMKSHTDERPHKCHLCGRA
.: : :...::::.::.:.:: :::: ..
CCDS58 MFTSSRMSSFNRHMKTHTSEKPHLCHLCLKT
10 20 30
310 320 330 340 350 360
pF1KB5 FRTVTLLRNHLNTHTGTRPHKCPDCDMAFVTSGELVRHRRYKHTHEKPFKCSMCDYASVE
::::::::::.::::::::.:: ::.:::::::::::::::::::::::::::: :::::
CCDS58 FRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASVE
40 50 60 70 80 90
370 380 390 400 410 420
pF1KB5 VSKLKRHIRSHTGERPFQCSLCSYASRDTYKLKRHMRTHSGEKPYECYICHARFTQSGTM
.::::::.::::::::::: ::::::::::::::::::::::::::.:::.::::::::
CCDS58 ASKLKRHVRSHTGERPFQCCQCSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQSGTM
100 110 120 130 140 150
430 440 450 460 470 480
pF1KB5 KMHILQKHTENVAKFHCPHCDTVIARKSDLGVHLRKQHSYIEQGKKCRYCDAVFHERYAL
:.:::::: ::: :..:::: :.::::::: ::.:. :.: :::::.:::::::::
CCDS58 KIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHERYAL
160 170 180 190 200 210
490 500 510 520 530 540
pF1KB5 IQHQKSHKNEKRFKCDQCDYACRQERHMIMHKRTHTGEKPYACSHCDKTFRQKQLLDMHF
:::::.::::::::: .:.:::.::::: : ::::::::..: :.: :::::::. ::
CCDS58 IQHQKTHKNEKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCFRQKQLLNAHF
220 230 240 250 260 270
550 560 570 580 590 600
pF1KB5 KRYHDPNFVPAAFVCSKCGKTFTRRNTMARHADNCAGPDGVEGENGGETKKSKRGRKRKM
..::: ::.:... :::::: :.: .. ::...:.. .. . .: :..: ::::.
CCDS58 RKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASG----KGRRTRKRKQ
280 290 300 310 320
610 620 630 640 650 660
pF1KB5 RSKKEDSSDSENAEPDLDDNEDEEEPAVEIEPEPEPQPVTPAPPPAKKRRGRPPGRTNQP
:: .. ...:
CCDS58 TILKEATKGQKEAAKGWKEAANGDGVISAHRNLCLLGSSDSHASVSGAGITDARHHAWLI
330 340 350 360 370 380
727 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 22:26:35 2016 done: Thu Nov 3 22:26:36 2016
Total Scan time: 3.970 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]