FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3810, 500 aa
1>>>pF1KB3810 500 - 500 aa - 500 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.2986+/-0.00119; mu= -1.0245+/- 0.069
mean_var=306.3465+/-69.252, 0's: 0 Z-trim(110.4): 783 B-trim: 0 in 0/51
Lambda= 0.073277
statistics sampled from 10701 (11606) to 10701 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.711), E-opt: 0.2 (0.357), width: 16
Scan time: 3.360
The best scores are: opt bits E(32554)
CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8 ( 500) 3399 373.6 2.8e-103
CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8 ( 418) 2831 313.5 3e-85
CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20 ( 496) 1458 168.4 1.7e-41
CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6 ( 463) 1293 150.9 2.8e-36
CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6 ( 411) 1029 122.9 6.5e-28
CCDS68161.1 CTCFL gene_id:140690|Hs108|chr20 ( 299) 497 66.6 4.5e-11
CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20 ( 403) 497 66.7 5.5e-11
CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20 ( 422) 497 66.7 5.7e-11
CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20 ( 460) 497 66.8 6e-11
CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20 ( 573) 497 66.9 7e-11
CCDS68164.1 CTCFL gene_id:140690|Hs108|chr20 ( 627) 497 66.9 7.4e-11
CCDS13459.1 CTCFL gene_id:140690|Hs108|chr20 ( 663) 497 66.9 7.7e-11
CCDS58781.1 CTCFL gene_id:140690|Hs108|chr20 ( 665) 497 66.9 7.7e-11
CCDS58780.1 CTCFL gene_id:140690|Hs108|chr20 ( 700) 497 66.9 8e-11
>>CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8 (500 aa)
initn: 3399 init1: 3399 opt: 3399 Z-score: 1967.6 bits: 373.6 E(32554): 2.8e-103
Smith-Waterman score: 3399; 99.8% identity (100.0% similar) in 500 aa overlap (1-500:1-500)
10 20 30 40 50 60
pF1KB3 MATVIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MATVIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGER
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 PYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKET
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 FKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAGKSSGGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 FKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAGKSSGGV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 KEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 KEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQEL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 LKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPFTNTLQLNLYNTPFQSMQS
:::::::::::::::::::::::::::::::::::.::::::::::::::::::::::::
CCDS61 LKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELLSKPFTNTLQLNLYNTPFQSMQS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 SGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 SGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESYL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPALDFSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPALDFSQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 LFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLHSLSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 LFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLHSLSA
430 440 450 460 470 480
490 500
pF1KB3 AFTSSLSTSTTLPRFHQAFQ
::::::::::::::::::::
CCDS61 AFTSSLSTSTTLPRFHQAFQ
490 500
>>CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8 (418 aa)
initn: 2831 init1: 2831 opt: 2831 Z-score: 1644.0 bits: 313.5 E(32554): 3e-85
Smith-Waterman score: 2831; 99.8% identity (100.0% similar) in 418 aa overlap (83-500:1-418)
60 70 80 90 100 110
pF1KB3 SYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLH
::::::::::::::::::::::::::::::
CCDS47 MATHSPEKTHKCNYCEKMFHRKDHLKNHLH
10 20 30
120 130 140 150 160 170
pF1KB3 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB3 AGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 AGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHM
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB3 KKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPFTNTLQLNLYN
:::::::::::::::::::::::::::::::::::::::::::.::::::::::::::::
CCDS47 KKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELLSKPFTNTLQLNLYN
160 170 180 190 200 210
300 310 320 330 340 350
pF1KB3 TPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL
220 230 240 250 260 270
360 370 380 390 400 410
pF1KB3 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN
280 290 300 310 320 330
420 430 440 450 460 470
pF1KB3 TPALDFSQLFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TPALDFSQLFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGL
340 350 360 370 380 390
480 490 500
pF1KB3 GSLHSLSAAFTSSLSTSTTLPRFHQAFQ
::::::::::::::::::::::::::::
CCDS47 GSLHSLSAAFTSSLSTSTTLPRFHQAFQ
400 410
>>CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20 (496 aa)
initn: 1626 init1: 1238 opt: 1458 Z-score: 858.7 bits: 168.4 E(32554): 1.7e-41
Smith-Waterman score: 1715; 52.2% identity (75.2% similar) in 504 aa overlap (3-500:6-496)
10 20 30 40 50
pF1KB3 MATVIPGDLSEVRDTQKVPSG--KRKRG-ETKPRKNFPCQLCDKAFNSVEKLKVHSY
: .: ...... ..: : :: :.. . . :.. :.. :::. ::
CCDS13 MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB3 SHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTH
. .:::.: : : :::.::::: ::::::: .: :.: ::.:::::::::.:::.::
CCDS13 PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB3 DPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAG
:::::...: :::::::::::..::::.:::.::::.::::::::::: .::::::.:.
CCDS13 DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB3 KSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKK
. .::.::::: :.:::::::::::::::.:::::::::::::::::::::::::::.::
CCDS13 RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB3 SHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLL-SKPFTNTLQLNLYNT
::.:::::.::::::.: ..:. .: .:.:: ::. . : :.. .: : . : ...:..
CCDS13 SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB3 PFQSMQSSGSAHQMI-TTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL
. .: :.: :... .:::.::. :.. . . .: :: ..:::: .:.: :
CCDS13 HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSY---LPDK-LP-
310 320 330 340 350
360 370 380 390 400 410
pF1KB3 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN
: :..:.: :: :.. :: . : .: :: .. . :.:: ..:. :
CCDS13 KVEVDSFLAELPGSLSLSSAEPQPAS-------PQPAAAAALLDEALLAKSPANLSEALC
360 370 380 390 400
420 430 440 450 460 470
pF1KB3 TPALDFSQLFNFIPLNGPPYNPL-SVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIG
. .:::.:..:.::: :: :: ..:.: :.::: ::. .. : : :: .. ..
CCDS13 AANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLN
410 420 430 440 450 460
480 490 500
pF1KB3 LGSLHSLSAAFTSSLSTSTTLPRFHQAFQ
.: :::: .:::.:: ::::::::::::
CCDS13 FGPLHSLPPVFTSGLS-STTLPRFHQAFQ
470 480 490
>>CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6 (463 aa)
initn: 1221 init1: 751 opt: 1293 Z-score: 764.8 bits: 150.9 E(32554): 2.8e-36
Smith-Waterman score: 1306; 46.6% identity (68.9% similar) in 476 aa overlap (34-500:4-463)
10 20 30 40 50 60
pF1KB3 VIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGERPYK
:::::: :.: ..::. .:.:::. :::::
CCDS52 MATFPCQLCGKTFLTLEKFTIHNYSHSRERPYK
10 20 30
70 80 90 100 110 120
pF1KB3 CIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKETFKC
:.: :: :::::.:::.::::::::.:.:.: .::: :.:::::::::.:::::: .: :
CCDS52 CVQPDCGKAFVSRYKLMRHMATHSPQKSHQCAHCEKTFNRKDHLKNHLQTHDPNKMAFGC
40 50 60 70 80 90
130 140 150 160 170 180
pF1KB3 EECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAG-KSSGGVKE
:::::.::: ::.:::::::::.:::::: :: . :: :::.:::.:: : .:.::
CCDS52 EECGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAHAEEKPPSGTKE
100 110 120 130 140 150
190 200 210 220 230 240
pF1KB3 KKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQELLK
:::::.::.: ::::::::::.::::: ::::::.:::::::::::::: ::.:.:::.:
CCDS52 KKHQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRHTKKTHSQELMK
160 170 180 190 200 210
250 260 270 280 290
pF1KB3 VKTEPVDFLDPF-TCNVSVPIKDELLPVMSLPSS--DLLSKPFTNTLQLNLYNTPFQSMQ
. . :.:. : : . : .: :: . : .: . :.. . .. . : :. :
CCDS52 ESLQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHSLTLSPPEQAAQ
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB3 SSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESY
. ...: ... : . :.: :: .::::. : :::.. ...
CCDS52 PMQPLPESLASLHPSVS-PGSPPPPLPNH----KYNTTSTSYS---PLASLPLKADTKGF
280 290 300 310 320
360 370 380 390 400 410
pF1KB3 L-MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPA-LD
. : .: :. :. .. . :.: :. :: ..: : . . :. :: ::
CCDS52 CNISLFEDLPL--QEPQSPQKLNPGFDLAKGN----AGKVNLPKELPADAVNLTIPASLD
330 340 350 360 370
420 430 440 450 460 470
pF1KB3 FSQLFNFIPLNGPP-YNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLH
.: :..: : : : .. ..:... .. : .: : : :. .:..::.:
CCDS52 LSPLLGFWQLPPPATQNTFGNSTLALGPGESLPHR-LSCLGQQQQEPPLAMGTVSLGQLP
380 390 400 410 420 430
480 490 500
pF1KB3 --SLSAAFTSSLSTSTTLPRFHQAFQ
. .:... . :. ::.::.::.
CCDS52 LPPIPHVFSAG-TGSAILPHFHHAFR
440 450 460
>>CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6 (411 aa)
initn: 957 init1: 487 opt: 1029 Z-score: 614.6 bits: 122.9 E(32554): 6.5e-28
Smith-Waterman score: 1042; 44.3% identity (66.7% similar) in 427 aa overlap (83-500:1-411)
60 70 80 90 100 110
pF1KB3 SYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLH
::::::.:.:.: .::: :.:::::::::.
CCDS52 MATHSPQKSHQCAHCEKTFNRKDHLKNHLQ
10 20 30
120 130 140 150 160 170
pF1KB3 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH
:::::: .: ::::::.::: ::.:::::::::.:::::: :: . :: :::.:::.:
CCDS52 THDPNKMAFGCEECGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAH
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB3 AG-KSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRH
: : .:.:::::::.::.: ::::::::::.::::: ::::::.::::::::::::::
CCDS52 AEEKPPSGTKEKKHQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRH
100 110 120 130 140 150
240 250 260 270 280
pF1KB3 MKKSHNQELLKVKTEPVDFLDPF-TCNVSVPIKDELLPVMSLPSS--DLLSKPFTNTLQL
::.:.:::.: . . :.:. : : . : .: :: . : .: . :.. . ..
CCDS52 TKKTHSQELMKESLQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHS
160 170 180 190 200 210
290 300 310 320 330 340
pF1KB3 NLYNTPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEK
. : :. : . ...: ... : . :.: :: .::::. :
CCDS52 LTLSPPEQAAQPMQPLPESLASLHPSVS-PGSPPPPLPNH----KYNTTSTSYS---PLA
220 230 240 250 260
350 360 370 380 390 400
pF1KB3 EQPLKGEIESYL-MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISI
:::.. ... . : .: :. :. .. . :.: :. :: ..: : .
CCDS52 SLPLKADTKGFCNISLFEDLPL--QEPQSPQKLNPGFDLAKGN----AGKVNLPKELPAD
270 280 290 300 310
410 420 430 440 450 460
pF1KB3 SDPLNTPA-LDFSQLFNFIPLNGPP-YNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQD
. :. :: ::.: :..: : : : .. ..:... .. : .: : : :.
CCDS52 AVNLTIPASLDLSPLLGFWQLPPPATQNTFGNSTLALGPGESLPHR-LSCLGQQQQEPPL
320 330 340 350 360 370
470 480 490 500
pF1KB3 PANTIGLGSLH--SLSAAFTSSLSTSTTLPRFHQAFQ
.:..::.: . .:... . :. ::.::.::.
CCDS52 AMGTVSLGQLPLPPIPHVFSAG-TGSAILPHFHHAFR
380 390 400 410
>>CCDS68161.1 CTCFL gene_id:140690|Hs108|chr20 (299 aa)
initn: 332 init1: 131 opt: 497 Z-score: 312.3 bits: 66.6 E(32554): 4.5e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:61-280)
10 20 30 40
pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
: :: ...: . .: : :..: :
CCDS68 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
40 50 60 70 80 90
50 60 70 80 90 100
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
. ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : ..
CCDS68 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
100 110 120 130 140
110 120 130 140 150 160
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
.: : :. : : ..: .:. : .. :. ::: ....: :. : .:.
CCDS68 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
150 160 170 180 190 200
170 180 190 200 210 220
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
.:..: :.: . ::. .:.::. .. . :. .:::.: : : : . :
CCDS68 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
210 220 230 240 250 260
230 240 250 260 270 280
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
.:. :. :..: :. ...
CCDS68 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWVLY
270 280 290
>>CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20 (403 aa)
initn: 315 init1: 131 opt: 497 Z-score: 310.7 bits: 66.7 E(32554): 5.5e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:61-280)
10 20 30 40
pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
: :: ...: . .: : :..: :
CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
40 50 60 70 80 90
50 60 70 80 90 100
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
. ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : ..
CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
100 110 120 130 140
110 120 130 140 150 160
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
.: : :. : : ..: .:. : .. :. ::: ....: :. : .:.
CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
150 160 170 180 190 200
170 180 190 200 210 220
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
.:..: :.: . ::. .:.::. .. . :. .:::.: : : : . :
CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
210 220 230 240 250 260
230 240 250 260 270 280
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
.:. :. :..: :. ...
CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASGKGRR
270 280 290 300 310 320
>>CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20 (422 aa)
initn: 332 init1: 131 opt: 497 Z-score: 310.5 bits: 66.7 E(32554): 5.7e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:118-337)
10 20 30 40
pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
: :: ...: . .: : :..: :
CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
90 100 110 120 130 140
50 60 70 80 90 100
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
. ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : ..
CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
150 160 170 180 190 200
110 120 130 140 150 160
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
.: : :. : : ..: .:. : .. :. ::: ....: :. : .:.
CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
210 220 230 240 250 260
170 180 190 200 210 220
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
.:..: :.: . ::. .:.::. .. . :. .:::.: : : : . :
CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
270 280 290 300 310
230 240 250 260 270 280
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
.:. :. :..: :. ...
CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWILWVGNSEVAELGGPGSGPLLRLQS
320 330 340 350 360 370
>>CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20 (460 aa)
initn: 315 init1: 131 opt: 497 Z-score: 310.0 bits: 66.8 E(32554): 6e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:118-337)
10 20 30 40
pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
: :: ...: . .: : :..: :
CCDS68 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
90 100 110 120 130 140
50 60 70 80 90 100
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
. ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : ..
CCDS68 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
150 160 170 180 190 200
110 120 130 140 150 160
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
.: : :. : : ..: .:. : .. :. ::: ....: :. : .:.
CCDS68 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
210 220 230 240 250 260
170 180 190 200 210 220
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
.:..: :.: . ::. .:.::. .. . :. .:::.: : : : . :
CCDS68 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
270 280 290 300 310
230 240 250 260 270 280
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
.:. :. :..: :. ...
CCDS68 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASGKGRR
320 330 340 350 360 370
>>CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20 (573 aa)
initn: 332 init1: 131 opt: 497 Z-score: 308.8 bits: 66.9 E(32554): 7e-11
Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:323-542)
10 20 30 40
pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN
: :: ...: . .: : :..: :
CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV
300 310 320 330 340 350
50 60 70 80 90 100
pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK
. ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : ..
CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS
360 370 380 390 400 410
110 120 130 140 150 160
pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST
.: : :. : : ..: .:. : .. :. ::: ....: :. : .:.
CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER
420 430 440 450 460 470
170 180 190 200 210 220
pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF
.:..: :.: . ::. .:.::. .. . :. .:::.: : : : . :
CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF
480 490 500 510 520
230 240 250 260 270 280
pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF
.:. :. :..: :. ...
CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWITSKWSGLKPQTFIT
530 540 550 560 570
500 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 13:59:03 2016 done: Thu Nov 3 13:59:03 2016
Total Scan time: 3.360 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]