FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1820, 1640 aa
1>>>pF1KSDA1820 1640 - 1640 aa - 1640 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.1911+/-0.00108; mu= -6.7906+/- 0.065
mean_var=383.0775+/-78.490, 0's: 0 Z-trim(115.0): 44 B-trim: 171 in 1/53
Lambda= 0.065529
statistics sampled from 15529 (15561) to 15529 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.766), E-opt: 0.2 (0.478), width: 16
Scan time: 5.970
The best scores are: opt bits E(32554)
CCDS11188.1 RAI1 gene_id:10743|Hs108|chr17 (1906) 10906 1046.4 0
CCDS14032.1 TCF20 gene_id:6942|Hs108|chr22 (1938) 793 90.4 6.4e-17
CCDS14033.1 TCF20 gene_id:6942|Hs108|chr22 (1960) 793 90.4 6.5e-17
>>CCDS11188.1 RAI1 gene_id:10743|Hs108|chr17 (1906 aa)
initn: 10906 init1: 10906 opt: 10906 Z-score: 5584.3 bits: 1046.4 E(32554): 0
Smith-Waterman score: 10906; 99.9% identity (100.0% similar) in 1598 aa overlap (1-1598:1-1598)
10 20 30 40 50 60
pF1KSD MQSFRERCGFHGKQQNYQQTSQETSRLENYRQPSQAGLSCDRQRLLAKDYYNPQPYPSYE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MQSFRERCGFHGKQQNYQQTSQETSRLENYRQPSQAGLSCDRQRLLAKDYYNPQPYPSYE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD GGAGTPSGTAAAVAADKYHRGSKALPTQQGLQGRPAFPGYGVQDSSPYPGRYAGEESLQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GGAGTPSGTAAAVAADKYHRGSKALPTQQGLQGRPAFPGYGVQDSSPYPGRYAGEESLQA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD WGAPQPPPPQPQPLPAGVAKYDENLMKKTAVPPSRQYAEQGAQVPFRTHSLHVQQPPPPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 WGAPQPPPPQPQPLPAGVAKYDENLMKKTAVPPSRQYAEQGAQVPFRTHSLHVQQPPPPQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD QPLAYPKLQRQKLQNDIASPLPFPQGTHFPQHSQSFPTSSTYSSSVQGGGQGAHSYKSCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QPLAYPKLQRQKLQNDIASPLPFPQGTHFPQHSQSFPTSSTYSSSVQGGGQGAHSYKSCT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD APTAQPHDRPLTASSSLAPGQRVQNLHAYQSGRLSYDQQQQQQQQQQQQQQALQSRHHAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 APTAQPHDRPLTASSSLAPGQRVQNLHAYQSGRLSYDQQQQQQQQQQQQQQALQSRHHAQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD ETLHYQNLAKYQHYGQQGQGYCQPDAAVRTPEQYYQTFSPSSSHSPARSVGRSPSYSSTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ETLHYQNLAKYQHYGQQGQGYCQPDAAVRTPEQYYQTFSPSSSHSPARSVGRSPSYSSTP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SPLMPNLENFPYSQQPLSTGAFPAGITDHSHFMPLLNPSPTDATSSVDTQAGNCKPLQKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SPLMPNLENFPYSQQPLSTGAFPAGITDHSHFMPLLNPSPTDATSSVDTQAGNCKPLQKD
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD KLPENLLSDLSLQSLTALTSQVENISNTVQQLLLSKAAVPQKKGVKNLVSRTPEQHKSQH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KLPENLLSDLSLQSLTALTSQVENISNTVQQLLLSKAAVPQKKGVKNLVSRTPEQHKSQH
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD CSPEGSGYSAEPAGTPLSEPPSSTPQSTHAEPQEADYLSGSEDPLERSFLYCNQARGSPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CSPEGSGYSAEPAGTPLSEPPSSTPQSTHAEPQEADYLSGSEDPLERSFLYCNQARGSPA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD RVNSNSKAKPESVSTCSVTSPDDMSTKSDDSFQSLHGSLPLDSFSKFVAGERDCPRLLLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RVNSNSKAKPESVSTCSVTSPDDMSTKSDDSFQSLHGSLPLDSFSKFVAGERDCPRLLLS
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD ALAQEDLASEILGLQEAIGEKADKAWAEAPSLVKDSSKPPFSLENHSACLDSVAKSAWPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ALAQEDLASEILGLQEAIGEKADKAWAEAPSLVKDSSKPPFSLENHSACLDSVAKSAWPR
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD PGEPEALPDSLQLDKGGNAKDFSPGLFEDPSVAFATPDPKKTTGPLSFGTKPTLGVPAPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PGEPEALPDSLQLDKGGNAKDFSPGLFEDPSVAFATPDPKKTTGPLSFGTKPTLGVPAPD
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD PTTAAFDCFPDTTAASSADSANPFAWPEENLGDACPRWGLHPGELTKGLEQGGKASDGIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PTTAAFDCFPDTTAASSADSANPFAWPEENLGDACPRWGLHPGELTKGLEQGGKASDGIS
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD KGDTHEASACLGFQEEDPPGEKVASLPGDFKQEEVGGVKEEAGGLLQCPEVAKADRWLED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KGDTHEASACLGFQEEDPPGEKVASLPGDFKQEEVGGVKEEAGGLLQCPEVAKADRWLED
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD SRHCCSTADFGDLPLLPPTSRKEDLEAEEEYSSLCELLGSPEQRPGMQDPLSPKAPLICT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SRHCCSTADFGDLPLLPPTSRKEDLEAEEEYSSLCELLGSPEQRPGMQDPLSPKAPLICT
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD KEEVEEVLDSKAGWGSPCHLSGESVILLGPTVGTESKVQSWFESSLSHMKPGEEGPDGER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KEEVEEVLDSKAGWGSPCHLSGESVILLGPTVGTESKVQSWFESSLSHMKPGEEGPDGER
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD APGDSTTSDASLAQKPNKPAVPEAPIAKKEPVPRGKSLRSRRVHRGLPEAEDSPCRAPVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 APGDSTTSDASLAQKPNKPAVPEAPIAKKEPVPRGKSLRSRRVHRGLPEAEDSPCRAPVL
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD PKDLLLPESCTGPPQGQMEGAGAPGRGASEGLPRMCTRSLTALSEPRTPGPPGLTTTPAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PKDLLLPESCTGPPQGQMEGAGAPGRGASEGLPRMCTRSLTALSEPRTPGPPGLTTTPAP
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD PDKLGGKQRAAFKSGKRVGKPSPKAASSPSNPAALPVASDSSPMGSKTKETDSPSTPGKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PDKLGGKQRAAFKSGKRVGKPSPKAASSPSNPAALPVASDSSPMGSKTKETDSPSTPGKD
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD QRSMILRSRTKTQEIFHSKRRRPSEGRLPNCRATKKLLDNSHLPATFKVSSSPQKEGRVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QRSMILRSRTKTQEIFHSKRRRPSEGRLPNCRATKKLLDNSHLPATFKVSSSPQKEGRVS
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD QRARVPKPGAGSKLSDRPLHALKRKSAFMAPVPTKKRNLVLRSRSSSSSNASGNGGDGKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QRARVPKPGAGSKLSDRPLHALKRKSAFMAPVPTKKRNLVLRSRSSSSSNASGNGGDGKE
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD ERPEGSPTLFKRMSSPKKAKPTKGNGEPATKLPPPETPDACLKLASRAAFQGAMKTKVLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ERPEGSPTLFKRMSSPKKAKPTKGNGEPATKLPPPETPDACLKLASRAAFQGAMKTKVLP
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD PRKGRGLKLEAIVQKITSPSLKKFACKAPGASPGNPLSPSLSDKDRGLKGAGGSPVGVEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PRKGRGLKLEAIVQKITSPSLKKFACKAPGASPGNPLSPSLSDKDRGLKGAGGSPVGVEE
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KSD GLVNVGTGQKLPTSGADPLCRNPTNRSLKGKLMNSKKLSSTDCFKTEAFTSPEALQPGGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GLVNVGTGQKLPTSGADPLCRNPTNRSLKGKLMNSKKLSSTDCFKTEAFTSPEALQPGGT
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KSD ALAPKKRSRKGRAGAHGLSKGPLEKRPYLGPALLLTPRDRASGTQGASEDNSGGGGKKPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ALAPKKRSRKGRAGAHGLSKGPLEKRPYLGPALLLTPRDRASGTQGASEDNSGGGGKKPK
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KSD MEELGLASQPPEGRPCQPQTRAQKQPGHTNYSSYSKRKRLTRGRAKNTTSSPCKGRAKRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MEELGLASQPPEGRPCQPQTRAQKQPGHTNYSSYSKRKRLTRGRAKNTTSSPCKGRAKRR
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KSD RQQQVLPLDPAEPEIRLKYISSCKRLRSDSRTPAFSPLEPSLGAQNPRSGQNAPPAPADA
:::::::::::::::::::::::::::::::::::::.
CCDS11 RQQQVLPLDPAEPEIRLKYISSCKRLRSDSRTPAFSPFVRVEKRDAFTTICTVVNSPGDA
1570 1580 1590 1600 1610 1620
1630 1640
pF1KSD RPLCTTRDRRAYSAREQGQR
CCDS11 PKPHRKPSSSASSSSSSSSFSLDAAGASLATLPGGSILQPRPSLPLSSTMHLGPVVSKAL
1630 1640 1650 1660 1670 1680
>>CCDS14032.1 TCF20 gene_id:6942|Hs108|chr22 (1938 aa)
initn: 579 init1: 296 opt: 793 Z-score: 417.2 bits: 90.4 E(32554): 6.4e-17
Smith-Waterman score: 1072; 25.6% identity (51.9% similar) in 1745 aa overlap (1-1597:1-1633)
10 20 30 40 50 60
pF1KSD MQSFRERCGFHGKQQNYQQTSQETSRLENYRQPSQAGLSCDRQRLLAKDYYNPQPYPSYE
::::::. ..::.::.: : . .::::.. .: :: : . . . :
CCDS14 MQSFREQSSYHGNQQSYPQEVHGSSRLEEF-SPRQA------QMFQNFGGTGGSSGSSGS
10 20 30 40 50
70 80 90 100 110
pF1KSD GGAGTPSGTAAAVAA----DKYHRGSKALPTQQGLQGRPAFPGYGVQDSSPYPGRYAGEE
:..: :.:::.:: . :.: ... . : : : ..: : .
CCDS14 GSGGGRRGAAAAAAAMASETSGHQGYQGFRKEAGDFYYMAGNKDPVTTGTPQPPQRRPSG
60 70 80 90 100 110
120 130 140 150 160
pF1KSD SLQAWGAPQPPP-----------PQPQPLPAG---VAKYDENLMKKTAVPPSRQYAEQGA
.:..: :: : : .: :..:... . : : :: .:..
CCDS14 PVQSYGPPQGSSFGNQYGSEGHVGQFQAQHSGLGGVSHYQQDYTGPFS-PGSAQYQQQAS
120 130 140 150 160 170
170 180 190 200
pF1KSD ------QVPFRTHSLHVQQPPPPQQPLAYPKLQRQKLQNDIASPLPFPQGT--------H
:: ..:. .. : :: . : . ..:: . : .:... .
CCDS14 SQQQQQQVQQLRQQLYQSHQPLPQAT-GQPASSSSHLQ-PMQRPSTLPSSAAGYQLRVGQ
180 190 200 210 220 230
210 220 230 240 250 260
pF1KSD FPQHSQSFPTSSTYSS--SVQGGGQGAHSYK-SCTAPTAQPHDRPLTASSSLAPGQRVQN
: :: :: .::. :: : : .:...:: : .. ... .. ..:.. : : .:.
CCDS14 FGQHYQSSASSSSSSSFPSPQRFSQSGQSYDGSYNVNAGSQYEGHNVGSNAQAYG--TQS
240 250 260 270 280
270 280 290 300 310 320
pF1KSD LHAYQSGRL-SYDQQQ--QQQQQQQQQQQALQSRHHAQETLHYQNLA-KYQHYGQQGQGY
..:: . ...: . : :: ::::: :..: .:....: : : : .: :: :
CCDS14 NYSYQPQSMKNFEQAKIPQGTQQGQQQQQPQQQQHPSQHVMQYTNAATKLPLQSQVGQ-Y
290 300 310 320 330 340
330 340 350 360 370 380
pF1KSD CQPDAAVRTPEQYYQTFSPSSSHSPARSVGRSPSYSSTPSPLMPNLENFPYSQQPLSTGA
::.. ::.: :..:.::: :. ::: :: .::: :::::::: . ::. .: :.
CCDS14 NQPEVPVRSPMQFHQNFSPISNPSPAASVVQSPSCSSTPSPLMQTGENLQCGQ-----GS
350 360 370 380 390 400
390 400 410 420 430 440
pF1KSD FPAGITDHS-HFMPLLNPSPTDATSSVDTQAGNCKPLQKDKLPENLLSDLSLQSLTALTS
: : .. ..:: :.:.:. : ...:.. : . . .::. :.: .:.::.::..
CCDS14 VPMGSRNRILQLMPQLSPTPS-MMPSPNSHAAGFKGFGLEGVPEKRLTDPGLSSLSALST
410 420 430 440 450 460
450 460 470 480 490
pF1KSD QVENISNTVQQLLLSKAAVPQKKGVKNLVSRTPEQHKSQHCS-PEGSGYSAEPAGTPLSE
:: :. ::::..::: : .:::: : : ..:.. :. :::. : .:..:
CCDS14 QVANLPNTVQHMLLSDALTPQKKTSK----RPSSSKKADSCTNSEGSSQPEEQLKSPMAE
470 480 490 500 510
500 510 520 530 540 550
pF1KSD P-PSSTPQSTHAEPQEADYLSGSEDPLERSFL--YCNQARGSPARVNSNSKAKPESVSTC
.. .:.. . ... :::. . .. ..: .:::. ... .: ...
CCDS14 SLDGGCSSSSEDQGERVRQLSGQSTSSDTTYKGGASEKAGSSPAQ---GAQNEPPRLNAS
520 530 540 550 560 570
560 570 580 590 600 610
pF1KSD SVTSPDDMSTKSDDSFQSLHGSLPLDSFSKFVAGERDCPRLLLSALAQEDLASEILGLQE
.. . : . : .::.: .. ..:. .. ..: ..... :
CCDS14 PAAREEATSPGAKD--------MPLSSDGNPKVNEKTVGVIV----SREAMTGRV----E
580 590 600 610
620 630 640 650 660 670
pF1KSD AIGEKADKAWAEAPSLVKDSSKPPFSLENHSACLDSVAKSAWPRPGEPEALPDSLQLDKG
: . . . :. ...:: : .: : :. :.: . . . :..
CCDS14 KPGGQDKGSQEDDPAA---TQRPP---SNGGAKETSHASLPQPEPPGGGGSKGNKNGDNN
620 630 640 650 660 670
680 690 700 710 720 730
pF1KSD GNAKDFSPGLFEDPSVA--FAT-PDPKKTTGPLSFGTKPTLGVPAPDPTTAAFDCFPDTT
.: . . : ... :.. .:.:. : : .. : ..: .: ....: .: :
CCDS14 SNHNGEGNGQSGHSAAGPGFTSRTEPSKSPGSLRYSYKDSFGSAVPR-NVSGFPQYP--T
680 690 700 710 720
740 750 760 770 780 790
pF1KSD AASSADSANPFAWPEENLGDACPRWGLHPGELTKGLEQGGKASDGISKGDTHEASACLGF
. ..: :. : : : :. : . :. . : . .:.: .. :
CCDS14 GQEKGD----FTGHGERKG----RNEKFPSLLQEVLQGYHHHPDRRYSRSTQEHQGMAGS
730 740 750 760 770 780
800 810 820 830 840 850
pF1KSD QEEDPPGEKVASLPGDFKQEEVGGVKEEAGGLLQCPEVAKADRWLEDSRHCCSTA-DFGD
: . ..: ... .. : ... :.::. :. : :. ::: .. .
CCDS14 LEGTTRPNVLVSQTNELASR--GLLNKSIGSLLENPH------WGPWERKSSSTAPEMKQ
790 800 810 820 830
860 870 880 890 900
pF1KSD LPLLP-PTSRKEDLEAEEEYSSLCELLGSPEQRPGMQDPLSPKAPLICTKEEVEEVL---
. : : :: ..: . :: : :: .: .. .:: .. .. . :
CCDS14 INLTDYPIPRKFEIEPQ---SSAHEPGGSLSERRSVICDISPLRQIV--RDPGAHSLGHM
840 850 860 870 880
910 920 930 940
pF1KSD --DSKAGWGSPCHLS-GESVILLGPTVGTESKVQSW--------FESSLS----------
:.. : .. . . ..:::: : :. :.:..: ::.: :
CCDS14 SADTRIGRNDRLNPTLSQSVILPGGLVSMETKLKSQSGQIKEEDFEQSKSQASFNNKKSG
890 900 910 920 930 940
950 960 970 980 990
pF1KSD -HMKPG---EEGPDGERAPGDSTTSDAS-LAQKPNKPA-VPEAP--IAKKEPVPRGKSLR
: .: .:. :. .:: .: .. : . . ..:. . ..: .. .: . ::.:
CCDS14 DHCHPPSIKHESYRGNASPGAATHDSLSDYGPQDSRPTPMRRVPGRVGGREGM-RGRS--
950 960 970 980 990 1000
1000 1010 1020 1030 1040 1050
pF1KSD SRRVHRGLPEAEDSP--CRAPVLPKDLLLPESCTGPPQGQMEGAGAPGRGASEGLPRMCT
. : . . :: :.: . :. : ... . .: :: : .
CCDS14 PSQYHDFAEKLKMSPGRSRGPGGDPHHMNPHM-TFSERANRSSLHTPFSPNSETL----A
1010 1020 1030 1040 1050 1060
1060 1070 1080 1090 1100
pF1KSD RSLTALSEPRTPGPP--GLTTTPAPPDKLGGKQRAAFK---SGKRVG--------KPSPK
. : .. .. : : ::.. .. .: .: ::. : . .:.
CCDS14 SAYHANTRAHAYGDPNAGLNSQLHYKRQMYQQQPEEYKDWSSGSAQGVIAAAQHRQEGPR
1070 1080 1090 1100 1110 1120
1110 1120 1130 1140
pF1KSD AASSPSNPAAL-----PVASDSSPM--GSKTKETDSPS----------TPGKDQRSMILR
.:: . : :. .:.. : : . .:: . : ...: :.
CCDS14 --KSPRQQQFLDRVRSPLKNDKDGMMYGPPVGTYHDPSAQEAGRCLMSSDGLPNKGMELK
1130 1140 1150 1160 1170
1150 1160 1170 1180 1190 1200
pF1KSD SRT-KTQEIFH--SKRRRPSEGRLPNCRATKKLLDNSHLPATFKVSSSPQ--KEGRVSQR
. : :: :.. :... : ...: : .. . : : : : :
CCDS14 HGSQKLQESCWDLSRQTSPAKSSGPPGMSSQKRYGPPHETDGHGLAEATQSSKPGSVMLR
1180 1190 1200 1210 1220 1230
1210 1220 1230 1240 1250 1260
pF1KSD ARVPKPGAGSKLSDRPLHALKRKSAFMAPVPTKKRNLVLRSRSSSSSNASGNGGDGKEER
:: .. :. :: .: .:..:.:.:... ... ::.. .: ...:
CCDS14 L----PGQEDHSSQNPLIMRRRVRSFISPIPSKRQSQDVKN---SSTEDKGRLLHSSKEG
1240 1250 1260 1270 1280 1290
1270 1280 1290 1300 1310 1320
pF1KSD PEGSPTLFKRMSSPKKAKPTKGNGEPATKLPPPETPDACLKLASRAAFQGAMKTKVLPPR
. . . . ..: . : . . . . :: :.. . : ... . :::.::::
CCDS14 ADKAFNSYAHLSHSQDIK-SIPKRDSSKDLPSPDSRN-C----PAVTLTSPAKTKILPPR
1300 1310 1320 1330 1340
1330 1340 1350 1360 1370 1380
pF1KSD KGRGLKLEAIVQKITSPSLKKFACKAPGASPGNPLSPSLSDKDRGLKGAGGSPVGVEEGL
:::::::::::::::::.... : . . . :. . .:.: :. .: : : :
CCDS14 KGRGLKLEAIVQKITSPNIRRSASSNSAEAGGDTV--TLDDI---LSLKSGPPEG---GS
1350 1360 1370 1380 1390
1390 1400 1410 1420 1430
pF1KSD VNVGTGQKLPTSG--ADPLCRNPTNRSL--KGKLMNSK---KLSSTDCFKTE--AFTSPE
: : .. .: :. : .:.:. : . : :. . : : ::: : :
CCDS14 VAVQDADIEKRKGEVASDLV-SPANQELHVEKPLPRSSEEWRGSVDDKVKTETHAETVTA
1400 1410 1420 1430 1440 1450
1440 1450 1460 1470 1480
pF1KSD ALQPGG---TALAPKKRSRKGRAGAHGLSKGPL--EKRPYLGPALLLTPR------DRAS
. .: : .. . : : .:: . . .:: . :. .:.:. .. .
CCDS14 GKEPPGAMTSTTSQKPGSNQGRPDGSLGGTAPLIFPDSKNVPPVGILAPEANPKAEEKEN
1460 1470 1480 1490 1500 1510
1490 1500 1510 1520 1530
pF1KSD GTQGASEDNSG----G---GGKKPKMEELG-LASQPPEGRPCQPQTRAQKQP-GHTNYSS
: : . : : .::: : . .: . .: . .: : . . : : ..
CCDS14 DTVTISPKQEGFPPKGYFPSGKK-KGRPIGSVNKQKKQQQPPPPPPQPPQIPEGSADGEP
1520 1530 1540 1550 1560 1570
1540 1550 1560 1570 1580 1590
pF1KSD YSKRKRLTRGRAKNTTSSPCKGRAKRRRQQQVLPL-DPAEPEIRLKYISSCKRLRSDSRT
:..: : : : ..: ..:. .:..:. .: ::::.::: .. ..:...
CCDS14 KPKKQRQRRERRK-PGAQP-----RKRKTKQAVPIVEPQEPEIKLKYATQ-PLDKTDAKN
1580 1590 1600 1610 1620
1600 1610 1620 1630 1640
pF1KSD PAFSPLEPSLGAQNPRSGQNAPPAPADARPLCTTRDRRAYSAREQGQR
.: :
CCDS14 KSFYPYIHVVNKCELGAVCTIINAEEEEQTKLVRGRKGQRSLTPPPSSTESKALPASSFM
1630 1640 1650 1660 1670 1680
>>CCDS14033.1 TCF20 gene_id:6942|Hs108|chr22 (1960 aa)
initn: 579 init1: 296 opt: 793 Z-score: 417.2 bits: 90.4 E(32554): 6.5e-17
Smith-Waterman score: 1072; 25.6% identity (51.9% similar) in 1745 aa overlap (1-1597:1-1633)
10 20 30 40 50 60
pF1KSD MQSFRERCGFHGKQQNYQQTSQETSRLENYRQPSQAGLSCDRQRLLAKDYYNPQPYPSYE
::::::. ..::.::.: : . .::::.. .: :: : . . . :
CCDS14 MQSFREQSSYHGNQQSYPQEVHGSSRLEEF-SPRQA------QMFQNFGGTGGSSGSSGS
10 20 30 40 50
70 80 90 100 110
pF1KSD GGAGTPSGTAAAVAA----DKYHRGSKALPTQQGLQGRPAFPGYGVQDSSPYPGRYAGEE
:..: :.:::.:: . :.: ... . : : : ..: : .
CCDS14 GSGGGRRGAAAAAAAMASETSGHQGYQGFRKEAGDFYYMAGNKDPVTTGTPQPPQRRPSG
60 70 80 90 100 110
120 130 140 150 160
pF1KSD SLQAWGAPQPPP-----------PQPQPLPAG---VAKYDENLMKKTAVPPSRQYAEQGA
.:..: :: : : .: :..:... . : : :: .:..
CCDS14 PVQSYGPPQGSSFGNQYGSEGHVGQFQAQHSGLGGVSHYQQDYTGPFS-PGSAQYQQQAS
120 130 140 150 160 170
170 180 190 200
pF1KSD ------QVPFRTHSLHVQQPPPPQQPLAYPKLQRQKLQNDIASPLPFPQGT--------H
:: ..:. .. : :: . : . ..:: . : .:... .
CCDS14 SQQQQQQVQQLRQQLYQSHQPLPQAT-GQPASSSSHLQ-PMQRPSTLPSSAAGYQLRVGQ
180 190 200 210 220 230
210 220 230 240 250 260
pF1KSD FPQHSQSFPTSSTYSS--SVQGGGQGAHSYK-SCTAPTAQPHDRPLTASSSLAPGQRVQN
: :: :: .::. :: : : .:...:: : .. ... .. ..:.. : : .:.
CCDS14 FGQHYQSSASSSSSSSFPSPQRFSQSGQSYDGSYNVNAGSQYEGHNVGSNAQAYG--TQS
240 250 260 270 280
270 280 290 300 310 320
pF1KSD LHAYQSGRL-SYDQQQ--QQQQQQQQQQQALQSRHHAQETLHYQNLA-KYQHYGQQGQGY
..:: . ...: . : :: ::::: :..: .:....: : : : .: :: :
CCDS14 NYSYQPQSMKNFEQAKIPQGTQQGQQQQQPQQQQHPSQHVMQYTNAATKLPLQSQVGQ-Y
290 300 310 320 330 340
330 340 350 360 370 380
pF1KSD CQPDAAVRTPEQYYQTFSPSSSHSPARSVGRSPSYSSTPSPLMPNLENFPYSQQPLSTGA
::.. ::.: :..:.::: :. ::: :: .::: :::::::: . ::. .: :.
CCDS14 NQPEVPVRSPMQFHQNFSPISNPSPAASVVQSPSCSSTPSPLMQTGENLQCGQ-----GS
350 360 370 380 390 400
390 400 410 420 430 440
pF1KSD FPAGITDHS-HFMPLLNPSPTDATSSVDTQAGNCKPLQKDKLPENLLSDLSLQSLTALTS
: : .. ..:: :.:.:. : ...:.. : . . .::. :.: .:.::.::..
CCDS14 VPMGSRNRILQLMPQLSPTPS-MMPSPNSHAAGFKGFGLEGVPEKRLTDPGLSSLSALST
410 420 430 440 450 460
450 460 470 480 490
pF1KSD QVENISNTVQQLLLSKAAVPQKKGVKNLVSRTPEQHKSQHCS-PEGSGYSAEPAGTPLSE
:: :. ::::..::: : .:::: : : ..:.. :. :::. : .:..:
CCDS14 QVANLPNTVQHMLLSDALTPQKKTSK----RPSSSKKADSCTNSEGSSQPEEQLKSPMAE
470 480 490 500 510
500 510 520 530 540 550
pF1KSD P-PSSTPQSTHAEPQEADYLSGSEDPLERSFL--YCNQARGSPARVNSNSKAKPESVSTC
.. .:.. . ... :::. . .. ..: .:::. ... .: ...
CCDS14 SLDGGCSSSSEDQGERVRQLSGQSTSSDTTYKGGASEKAGSSPAQ---GAQNEPPRLNAS
520 530 540 550 560 570
560 570 580 590 600 610
pF1KSD SVTSPDDMSTKSDDSFQSLHGSLPLDSFSKFVAGERDCPRLLLSALAQEDLASEILGLQE
.. . : . : .::.: .. ..:. .. ..: ..... :
CCDS14 PAAREEATSPGAKD--------MPLSSDGNPKVNEKTVGVIV----SREAMTGRV----E
580 590 600 610
620 630 640 650 660 670
pF1KSD AIGEKADKAWAEAPSLVKDSSKPPFSLENHSACLDSVAKSAWPRPGEPEALPDSLQLDKG
: . . . :. ...:: : .: : :. :.: . . . :..
CCDS14 KPGGQDKGSQEDDPAA---TQRPP---SNGGAKETSHASLPQPEPPGGGGSKGNKNGDNN
620 630 640 650 660 670
680 690 700 710 720 730
pF1KSD GNAKDFSPGLFEDPSVA--FAT-PDPKKTTGPLSFGTKPTLGVPAPDPTTAAFDCFPDTT
.: . . : ... :.. .:.:. : : .. : ..: .: ....: .: :
CCDS14 SNHNGEGNGQSGHSAAGPGFTSRTEPSKSPGSLRYSYKDSFGSAVPR-NVSGFPQYP--T
680 690 700 710 720
740 750 760 770 780 790
pF1KSD AASSADSANPFAWPEENLGDACPRWGLHPGELTKGLEQGGKASDGISKGDTHEASACLGF
. ..: :. : : : :. : . :. . : . .:.: .. :
CCDS14 GQEKGD----FTGHGERKG----RNEKFPSLLQEVLQGYHHHPDRRYSRSTQEHQGMAGS
730 740 750 760 770 780
800 810 820 830 840 850
pF1KSD QEEDPPGEKVASLPGDFKQEEVGGVKEEAGGLLQCPEVAKADRWLEDSRHCCSTA-DFGD
: . ..: ... .. : ... :.::. :. : :. ::: .. .
CCDS14 LEGTTRPNVLVSQTNELASR--GLLNKSIGSLLENPH------WGPWERKSSSTAPEMKQ
790 800 810 820 830
860 870 880 890 900
pF1KSD LPLLP-PTSRKEDLEAEEEYSSLCELLGSPEQRPGMQDPLSPKAPLICTKEEVEEVL---
. : : :: ..: . :: : :: .: .. .:: .. .. . :
CCDS14 INLTDYPIPRKFEIEPQ---SSAHEPGGSLSERRSVICDISPLRQIV--RDPGAHSLGHM
840 850 860 870 880
910 920 930 940
pF1KSD --DSKAGWGSPCHLS-GESVILLGPTVGTESKVQSW--------FESSLS----------
:.. : .. . . ..:::: : :. :.:..: ::.: :
CCDS14 SADTRIGRNDRLNPTLSQSVILPGGLVSMETKLKSQSGQIKEEDFEQSKSQASFNNKKSG
890 900 910 920 930 940
950 960 970 980 990
pF1KSD -HMKPG---EEGPDGERAPGDSTTSDAS-LAQKPNKPA-VPEAP--IAKKEPVPRGKSLR
: .: .:. :. .:: .: .. : . . ..:. . ..: .. .: . ::.:
CCDS14 DHCHPPSIKHESYRGNASPGAATHDSLSDYGPQDSRPTPMRRVPGRVGGREGM-RGRS--
950 960 970 980 990 1000
1000 1010 1020 1030 1040 1050
pF1KSD SRRVHRGLPEAEDSP--CRAPVLPKDLLLPESCTGPPQGQMEGAGAPGRGASEGLPRMCT
. : . . :: :.: . :. : ... . .: :: : .
CCDS14 PSQYHDFAEKLKMSPGRSRGPGGDPHHMNPHM-TFSERANRSSLHTPFSPNSETL----A
1010 1020 1030 1040 1050 1060
1060 1070 1080 1090 1100
pF1KSD RSLTALSEPRTPGPP--GLTTTPAPPDKLGGKQRAAFK---SGKRVG--------KPSPK
. : .. .. : : ::.. .. .: .: ::. : . .:.
CCDS14 SAYHANTRAHAYGDPNAGLNSQLHYKRQMYQQQPEEYKDWSSGSAQGVIAAAQHRQEGPR
1070 1080 1090 1100 1110 1120
1110 1120 1130 1140
pF1KSD AASSPSNPAAL-----PVASDSSPM--GSKTKETDSPS----------TPGKDQRSMILR
.:: . : :. .:.. : : . .:: . : ...: :.
CCDS14 --KSPRQQQFLDRVRSPLKNDKDGMMYGPPVGTYHDPSAQEAGRCLMSSDGLPNKGMELK
1130 1140 1150 1160 1170
1150 1160 1170 1180 1190 1200
pF1KSD SRT-KTQEIFH--SKRRRPSEGRLPNCRATKKLLDNSHLPATFKVSSSPQ--KEGRVSQR
. : :: :.. :... : ...: : .. . : : : : :
CCDS14 HGSQKLQESCWDLSRQTSPAKSSGPPGMSSQKRYGPPHETDGHGLAEATQSSKPGSVMLR
1180 1190 1200 1210 1220 1230
1210 1220 1230 1240 1250 1260
pF1KSD ARVPKPGAGSKLSDRPLHALKRKSAFMAPVPTKKRNLVLRSRSSSSSNASGNGGDGKEER
:: .. :. :: .: .:..:.:.:... ... ::.. .: ...:
CCDS14 L----PGQEDHSSQNPLIMRRRVRSFISPIPSKRQSQDVKN---SSTEDKGRLLHSSKEG
1240 1250 1260 1270 1280 1290
1270 1280 1290 1300 1310 1320
pF1KSD PEGSPTLFKRMSSPKKAKPTKGNGEPATKLPPPETPDACLKLASRAAFQGAMKTKVLPPR
. . . . ..: . : . . . . :: :.. . : ... . :::.::::
CCDS14 ADKAFNSYAHLSHSQDIK-SIPKRDSSKDLPSPDSRN-C----PAVTLTSPAKTKILPPR
1300 1310 1320 1330 1340
1330 1340 1350 1360 1370 1380
pF1KSD KGRGLKLEAIVQKITSPSLKKFACKAPGASPGNPLSPSLSDKDRGLKGAGGSPVGVEEGL
:::::::::::::::::.... : . . . :. . .:.: :. .: : : :
CCDS14 KGRGLKLEAIVQKITSPNIRRSASSNSAEAGGDTV--TLDDI---LSLKSGPPEG---GS
1350 1360 1370 1380 1390
1390 1400 1410 1420 1430
pF1KSD VNVGTGQKLPTSG--ADPLCRNPTNRSL--KGKLMNSK---KLSSTDCFKTE--AFTSPE
: : .. .: :. : .:.:. : . : :. . : : ::: : :
CCDS14 VAVQDADIEKRKGEVASDLV-SPANQELHVEKPLPRSSEEWRGSVDDKVKTETHAETVTA
1400 1410 1420 1430 1440 1450
1440 1450 1460 1470 1480
pF1KSD ALQPGG---TALAPKKRSRKGRAGAHGLSKGPL--EKRPYLGPALLLTPR------DRAS
. .: : .. . : : .:: . . .:: . :. .:.:. .. .
CCDS14 GKEPPGAMTSTTSQKPGSNQGRPDGSLGGTAPLIFPDSKNVPPVGILAPEANPKAEEKEN
1460 1470 1480 1490 1500 1510
1490 1500 1510 1520 1530
pF1KSD GTQGASEDNSG----G---GGKKPKMEELG-LASQPPEGRPCQPQTRAQKQP-GHTNYSS
: : . : : .::: : . .: . .: . .: : . . : : ..
CCDS14 DTVTISPKQEGFPPKGYFPSGKK-KGRPIGSVNKQKKQQQPPPPPPQPPQIPEGSADGEP
1520 1530 1540 1550 1560 1570
1540 1550 1560 1570 1580 1590
pF1KSD YSKRKRLTRGRAKNTTSSPCKGRAKRRRQQQVLPL-DPAEPEIRLKYISSCKRLRSDSRT
:..: : : : ..: ..:. .:..:. .: ::::.::: .. ..:...
CCDS14 KPKKQRQRRERRK-PGAQP-----RKRKTKQAVPIVEPQEPEIKLKYATQ-PLDKTDAKN
1580 1590 1600 1610 1620
1600 1610 1620 1630 1640
pF1KSD PAFSPLEPSLGAQNPRSGQNAPPAPADARPLCTTRDRRAYSAREQGQR
.: :
CCDS14 KSFYPYIHVVNKCELGAVCTIINAEEEEQTKLVRGRKGQRSLTPPPSSTESKALPASSFM
1630 1640 1650 1660 1670 1680
1640 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 19:11:49 2016 done: Thu Nov 3 19:11:51 2016
Total Scan time: 5.970 Total Display time: 0.240
Function used was FASTA [36.3.4 Apr, 2011]