FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0037, 740 aa
1>>>pF1KE0037 740 - 740 aa - 740 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3173+/-0.000931; mu= 14.9968+/- 0.056
mean_var=85.1590+/-17.259, 0's: 0 Z-trim(106.7): 27 B-trim: 0 in 0/51
Lambda= 0.138982
statistics sampled from 9146 (9164) to 9146 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.646), E-opt: 0.2 (0.282), width: 16
Scan time: 3.640
The best scores are: opt bits E(32554)
CCDS31604.1 NAALADL1 gene_id:10004|Hs108|chr11 ( 740) 4911 995.0 0
CCDS7946.1 FOLH1 gene_id:2346|Hs108|chr11 ( 750) 1737 358.6 2e-98
CCDS53628.1 FOLH1 gene_id:2346|Hs108|chr11 ( 735) 1726 356.4 9e-98
CCDS8288.1 NAALAD2 gene_id:10003|Hs108|chr11 ( 740) 1721 355.4 1.8e-97
CCDS31493.1 FOLH1 gene_id:2346|Hs108|chr11 ( 719) 1506 312.3 1.7e-84
CCDS53627.1 FOLH1 gene_id:2346|Hs108|chr11 ( 704) 1495 310.1 7.6e-84
CCDS53626.1 FOLH1 gene_id:2346|Hs108|chr11 ( 442) 1135 237.8 2.7e-62
CCDS73364.1 NAALAD2 gene_id:10003|Hs108|chr11 ( 707) 1099 230.7 6.1e-60
CCDS34707.1 TFR2 gene_id:7036|Hs108|chr7 ( 801) 413 93.2 1.7e-18
CCDS82891.1 TFRC gene_id:7037|Hs108|chr3 ( 679) 381 86.7 1.3e-16
CCDS3312.1 TFRC gene_id:7037|Hs108|chr3 ( 760) 381 86.7 1.4e-16
CCDS46960.1 NAALADL2 gene_id:254827|Hs108|chr3 ( 795) 314 73.3 1.6e-12
>>CCDS31604.1 NAALADL1 gene_id:10004|Hs108|chr11 (740 aa)
initn: 4911 init1: 4911 opt: 4911 Z-score: 5320.2 bits: 995.0 E(32554): 0
Smith-Waterman score: 4911; 100.0% identity (100.0% similar) in 740 aa overlap (1-740:1-740)
10 20 30 40 50 60
pF1KE0 MQWTKVLGLGLGAAALLGLGIILGHFAIPKKANSLAPQDLDLEILETVMGQLDAHRIREN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MQWTKVLGLGLGAAALLGLGIILGHFAIPKKANSLAPQDLDLEILETVMGQLDAHRIREN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 LRELSREPHLASSPRDEDLVQLLLQRWKDPESGLDSAEASTYEVLLSFPSQEQPNVVDIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LRELSREPHLASSPRDEDLVQLLLQRWKDPESGLDSAEASTYEVLLSFPSQEQPNVVDIV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 GPTGGIIHSCHRTEENVTGEQGGPDVVQPYAAYAPSGTPQGLLVYANRGAEEDFKELQTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GPTGGIIHSCHRTEENVTGEQGGPDVVQPYAAYAPSGTPQGLLVYANRGAEEDFKELQTQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 GIKLEGTIALTRYGGVGRGAKAVNAAKHGVAGVLVYTDPADINDGLSSPDETFPNSWYLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GIKLEGTIALTRYGGVGRGAKAVNAAKHGVAGVLVYTDPADINDGLSSPDETFPNSWYLP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 PSGVERGSYYEYFGDPLTPYLPAVPSSFRVDLANVSGFPPIPTQPIGFQDARDLLCNLNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PSGVERGSYYEYFGDPLTPYLPAVPSSFRVDLANVSGFPPIPTQPIGFQDARDLLCNLNG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 TLAPATWQGALGCHYRLGPGFRPDGDFPADSQVNVSVYNRLELRNSSNVLGIIRGAVEPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 TLAPATWQGALGCHYRLGPGFRPDGDFPADSQVNVSVYNRLELRNSSNVLGIIRGAVEPD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 RYVLYGNHRDSWVHGAVDPSSGTAVLLELSRVLGTLLKKGTWRPRRSIVFASWGAEEFGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RYVLYGNHRDSWVHGAVDPSSGTAVLLELSRVLGTLLKKGTWRPRRSIVFASWGAEEFGL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 IGSTEFTEEFFNKLQERTVAYINVDISVFANATLRVQGTPPVQSVVFSATKEIRSPGPGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 IGSTEFTEEFFNKLQERTVAYINVDISVFANATLRVQGTPPVQSVVFSATKEIRSPGPGD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 LSIYDNWIRYFNRSSPVYGLVPSLGSLGAGSDYAPFVHFLGISSMDIAYTYDRSKTSARI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LSIYDNWIRYFNRSSPVYGLVPSLGSLGAGSDYAPFVHFLGISSMDIAYTYDRSKTSARI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 YPTYHTAFDTFDYVDKFLDPGFSSHQAVARTAGSVILRLSDSFFLPLKVSDYSETLRSFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 YPTYHTAFDTFDYVDKFLDPGFSSHQAVARTAGSVILRLSDSFFLPLKVSDYSETLRSFL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 QAAQQDLGALLEQHSISLGPLVTAVEKFEAEAAALGQRISTLQKGSPDPLQVRMLNDQLM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QAAQQDLGALLEQHSISLGPLVTAVEKFEAEAAALGQRISTLQKGSPDPLQVRMLNDQLM
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 LLERTFLNPRAFPEERYYSHVLWAPRTGSVVTFPGLSNACSRARDTASGSEAWAEVQRQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LLERTFLNPRAFPEERYYSHVLWAPRTGSVVTFPGLSNACSRARDTASGSEAWAEVQRQL
670 680 690 700 710 720
730 740
pF1KE0 SIVVTALEGAAATLRPVADL
::::::::::::::::::::
CCDS31 SIVVTALEGAAATLRPVADL
730 740
>>CCDS7946.1 FOLH1 gene_id:2346|Hs108|chr11 (750 aa)
initn: 952 init1: 535 opt: 1737 Z-score: 1880.6 bits: 358.6 E(32554): 2e-98
Smith-Waterman score: 1740; 38.3% identity (70.3% similar) in 751 aa overlap (2-738:19-750)
10 20 30 40
pF1KE0 MQWTKVLGLGLGAAALLGLGIILGHFAIPK-KANSLAPQDLDL
.: . .: : :.... ::...: : . .:....:.
CCDS79 MWNLLHETDSAVATARRPRWLCAGALVL-AGGFFLLGFLFGWFIKSSNEATNITPK----
10 20 30 40 50
50 60 70 80 90 100
pF1KE0 EILETVMGQLDAHRIRENLRELSREPHLASSPRDEDLVQLLLQRWKDPESGLDSAEASTY
. ... . .: :. :.. : .... ::::.. .. .:.. . ..:: : ::::.: . :
CCDS79 HNMKAFLDELKAENIKKFLYNFTQIPHLAGTEQNFQLAKQIQSQWK--EFGLDSVELAHY
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE0 EVLLSFPSQEQPNVVDIVGPTGGIIHSCHRTEENVTGEQGGPDVVQPYAAYAPSGTPQGL
.::::.:.. .:: ..:.. :. : . : : .. :.: :..:..:.: :.:
CCDS79 DVLLSYPNKTHPNYISIINEDGNEIFNTSLFEPPPPGYENVSDIVPPFSAFSPQGMPEGD
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE0 LVYANRGAEEDFKELQTQ-GIKLEGTIALTRYGGVGRGAKAVNAAKHGVAGVLVYTDPAD
:::.: . ::: .:. . :. : :...::: : :: :. :: :. ::..:.::::
CCDS79 LVYVNYARTEDFFKLERDMKINCSGKIVIARYGKVFRGNKVKNAQLAGAKGVILYSDPAD
180 190 200 210 220 230
230 240 250 260 270
pF1KE0 -INDGLSSPDETFPNSWYLPPSGVERGSYYEY--FGDPLTPYLPAVPSSFRVDLANVSGF
. :..: .:..: :: .::.::. . :::::: :: ..: .:.. :.
CCDS79 YFAPGVKS----YPDGWNLPGGGVQRGNILNLNGAGDPLTPGYPANEYAYRRGIAEAVGL
240 250 260 270 280
280 290 300 310 320 330
pF1KE0 PPIPTQPIGFQDARDLLCNLNGTLAP-ATWQGALGCHYRLGPGFRPDGDFPADSQVNVSV
: ::..:::. ::. :: ...:. : ..:.:.: : .:::: :.: . ..:.. .
CCDS79 PSIPVHPIGYYDAQKLLEKMGGSAPPDSSWRGSLKVPYNVGPGF--TGNF-STQKVKMHI
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE0 YNRLELRNSSNVLGIIRGAVEPDRYVLYGNHRDSWVHGAVDPSSGTAVLLELSRVLGTLL
.. :. ::.: .::::::::::. :.:::::: :..::.::.::. :. : .:::
CCDS79 HSTNEVTRIYNVIGTLRGAVEPDRYVILGGHRDSWVFGGIDPQSGAAVVHEIVRSFGTLK
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE0 KKGTWRPRRSIVFASWGAEEFGLIGSTEFTEEFFNKLQERTVAYINVDISVFANATLRVQ
:.: :::::.:.:::: ::::::.::::..:: :::: :::::.: :. .: ::::.
CCDS79 KEG-WRPRRTILFASWDAEEFGLLGSTEWAEENSRLLQERGVAYINADSSIEGNYTLRVD
410 420 430 440 450 460
460 470 480 490 500 510
pF1KE0 GTPPVQSVVFSATKEIRSPGPG--DLSIYDNWIRYFNRSSPVYGLVPSLGSLGAGSDYAP
:: . :.: . :::..:: : :.:..: . . :: .. .: ...::.:.:.
CCDS79 CTPLMYSLVHNLTKELKSPDEGFEGKSLYESWTK--KSPSPEFSGMPRISKLGSGNDFEV
470 480 490 500 510 520
520 530 540 550 560 570
pF1KE0 FVHFLGISSMDIAYTYDRSKTSARIYPTYHTAFDTFDYVDKFLDPGFSSHQAVARTAGSV
: . :::.: :: . .. :: ::....:.. :.:: :: :. : .::.. :..
CCDS79 FFQRLGIASGRARYTKNWETNKFSGYPLYHSVYETYELVEKFYDPMFKYHLTVAQVRGGM
530 540 550 560 570 580
580 590 600 610 620 630
pF1KE0 ILRLSDSFFLPLKVSDYSETLRSF---LQAAQQDLGALLEQHSISLGPLVTAVEKFEAEA
...:..:. ::. ::. .::.. . . .. .. .:.:. : .::..: :
CCDS79 VFELANSIVLPFDCRDYAVVLRKYADKIYSISMKHPQEMKTYSVSFDSLFSAVKNFTEIA
590 600 610 620 630 640
640 650 660 670 680 690
pF1KE0 AALGQRISTLQKGSPDPLQVRMLNDQLMLLERTFLNPRAFPEERYYSHVLWAPRTGSVV-
. ...:.. ..:. .:. .::.:::::.:::.:..: ..:.. .: ::..:: . .
CCDS79 SKFSERLQDFDKS--NPIVLRMMNDQLMFLERAFIDPLGLPDRPFYRHVIYAPSSHNKYA
650 660 670 680 690 700
700 710 720 730 740
pF1KE0 --TFPGLSNACSRARDTASGSEAWAEVQRQLSIVVTALEGAAATLRPVADL
.:::. .: .. .. :.::.::.::. ... ....:: :: ::
CCDS79 GESFPGIYDALFDIESKVDPSKAWGEVKRQIYVAAFTVQAAAETLSEVA
710 720 730 740 750
>>CCDS53628.1 FOLH1 gene_id:2346|Hs108|chr11 (735 aa)
initn: 952 init1: 535 opt: 1726 Z-score: 1868.8 bits: 356.4 E(32554): 9e-98
Smith-Waterman score: 1728; 38.8% identity (69.9% similar) in 745 aa overlap (9-738:9-735)
10 20 30 40 50
pF1KE0 MQWTKVLGLGLGAAALLG-LGIILGHFAIPK-KANSLAPQDLDLEILETVMGQLDAHRIR
: :.: : : :. :: : . .:....:. . ... . .: :. :.
CCDS53 MTAGSSYPLFLAAYACTGCLAERLGWFIKSSNEATNITPK----HNMKAFLDELKAENIK
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 ENLRELSREPHLASSPRDEDLVQLLLQRWKDPESGLDSAEASTYEVLLSFPSQEQPNVVD
. : .... ::::.. .. .:.. . ..:: : ::::.: . :.::::.:.. .:: ..
CCDS53 KFLYNFTQIPHLAGTEQNFQLAKQIQSQWK--EFGLDSVELAHYDVLLSYPNKTHPNYIS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 IVGPTGGIIHSCHRTEENVTGEQGGPDVVQPYAAYAPSGTPQGLLVYANRGAEEDFKELQ
:.. :. : . : : .. :.: :..:..:.: :.: :::.: . ::: .:.
CCDS53 IINEDGNEIFNTSLFEPPPPGYENVSDIVPPFSAFSPQGMPEGDLVYVNYARTEDFFKLE
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 TQ-GIKLEGTIALTRYGGVGRGAKAVNAAKHGVAGVLVYTDPAD-INDGLSSPDETFPNS
. :. : :...::: : :: :. :: :. ::..:.:::: . :..: .:..
CCDS53 RDMKINCSGKIVIARYGKVFRGNKVKNAQLAGAKGVILYSDPADYFAPGVKS----YPDG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 WYLPPSGVERGSYYEY--FGDPLTPYLPAVPSSFRVDLANVSGFPPIPTQPIGFQDARDL
: :: .::.::. . :::::: :: ..: .:.. :.: ::..:::. ::. :
CCDS53 WNLPGGGVQRGNILNLNGAGDPLTPGYPANEYAYRRGIAEAVGLPSIPVHPIGYYDAQKL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 LCNLNGTLAP-ATWQGALGCHYRLGPGFRPDGDFPADSQVNVSVYNRLELRNSSNVLGII
: ...:. : ..:.:.: : .:::: :.: . ..:.. ... :. ::.: .
CCDS53 LEKMGGSAPPDSSWRGSLKVPYNVGPGFT--GNF-STQKVKMHIHSTNEVTRIYNVIGTL
300 310 320 330 340
360 370 380 390 400 410
pF1KE0 RGAVEPDRYVLYGNHRDSWVHGAVDPSSGTAVLLELSRVLGTLLKKGTWRPRRSIVFASW
::::::::::. :.:::::: :..::.::.::. :. : .::: :.: :::::.:.::::
CCDS53 RGAVEPDRYVILGGHRDSWVFGGIDPQSGAAVVHEIVRSFGTLKKEG-WRPRRTILFASW
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE0 GAEEFGLIGSTEFTEEFFNKLQERTVAYINVDISVFANATLRVQGTPPVQSVVFSATKEI
::::::.::::..:: :::: :::::.: :. .: ::::. :: . :.: . :::.
CCDS53 DAEEFGLLGSTEWAEENSRLLQERGVAYINADSSIEGNYTLRVDCTPLMYSLVHNLTKEL
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE0 RSPGPG--DLSIYDNWIRYFNRSSPVYGLVPSLGSLGAGSDYAPFVHFLGISSMDIAYTY
.:: : :.:..: . . :: .. .: ...::.:.:. : . :::.: ::
CCDS53 KSPDEGFEGKSLYESWTK--KSPSPEFSGMPRISKLGSGNDFEVFFQRLGIASGRARYTK
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE0 DRSKTSARIYPTYHTAFDTFDYVDKFLDPGFSSHQAVARTAGSVILRLSDSFFLPLKVSD
. .. :: ::....:.. :.:: :: :. : .::.. :.....:..:. ::. :
CCDS53 NWETNKFSGYPLYHSVYETYELVEKFYDPMFKYHLTVAQVRGGMVFELANSIVLPFDCRD
530 540 550 560 570 580
600 610 620 630 640
pF1KE0 YSETLRSF---LQAAQQDLGALLEQHSISLGPLVTAVEKFEAEAAALGQRISTLQKGSPD
:. .::.. . . .. .. .:.:. : .::..: :. ...:.. ..:. .
CCDS53 YAVVLRKYADKIYSISMKHPQEMKTYSVSFDSLFSAVKNFTEIASKFSERLQDFDKS--N
590 600 610 620 630 640
650 660 670 680 690 700
pF1KE0 PLQVRMLNDQLMLLERTFLNPRAFPEERYYSHVLWAPRTGSVV---TFPGLSNACSRARD
:. .::.:::::.:::.:..: ..:.. .: ::..:: . . .:::. .: ..
CCDS53 PIVLRMMNDQLMFLERAFIDPLGLPDRPFYRHVIYAPSSHNKYAGESFPGIYDALFDIES
650 660 670 680 690 700
710 720 730 740
pF1KE0 TASGSEAWAEVQRQLSIVVTALEGAAATLRPVADL
.. :.::.::.::. ... ....:: :: ::
CCDS53 KVDPSKAWGEVKRQIYVAAFTVQAAAETLSEVA
710 720 730
>>CCDS8288.1 NAALAD2 gene_id:10003|Hs108|chr11 (740 aa)
initn: 1168 init1: 544 opt: 1721 Z-score: 1863.3 bits: 355.4 E(32554): 1.8e-97
Smith-Waterman score: 1721; 39.0% identity (68.2% similar) in 741 aa overlap (13-737:15-739)
10 20 30 40 50
pF1KE0 MQWTKVLGLGLGAAALLG--LGIILGHFAIPKKANSLAPQDLDLEILETVMGQLDAHR
:::: . .:...: : : : .. . . : ..... :.
CCDS82 MAESRGRLYLWMCLAAALASFLMGFMVGWFIKPLKETTTSVR-YHQSIRWKLVSEMKAEN
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 IRENLRELSREPHLASSPRDEDLVQLLLQRWKDPESGLDSAEASTYEVLLSFPSQEQPNV
:. :: ... ::::.. .. :.. . .:: . :::::. :.::::.:.. . :
CCDS82 IKSFLRSFTKLPHLAGTEQNFLLAKKIQTQWK--KFGLDSAKLVHYDVLLSYPNETNANY
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 VDIVGPTGGIIHSCHRTEENVTGEQGGPDVVQPYAAYAPSGTPQGLLVYANRGAEEDFKE
..:: : . : : .. ..: :: :.. .: :.: :::.: . ::: .
CCDS82 ISIVDEHETEIFKTSYLEPPPDGYENVTNIVPPYNAFSAQGMPEGDLVYVNYARTEDFFK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 LQTQ-GIKLEGTIALTRYGGVGRGAKAVNAAKHGVAGVLVYTDPADINDGLSSPD-ETFP
:. . ::. : :...::: . :: :. :: :. :...:.:::: .:. . .:
CCDS82 LEREMGINCTGKIVIARYGKIFRGNKVKNAMLAGAIGIILYSDPADY----FAPEVQPYP
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 NSWYLPPSGVERGSYYEY--FGDPLTPYLPAVPSSFRVDLANVSGFPPIPTQPIGFQDAR
..: :: ....::. . :::::: :: .::.:. . :.: ::..:::..::.
CCDS82 KGWNLPGTAAQRGNVLNLNGAGDPLTPGYPAKEYTFRLDVEEGVGIPRIPVHPIGYNDAE
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 DLLCNLNGTLAP-ATWQGALGCHYRLGPGFRPDGDFPADSQVNVSVYNRLELRNSSNVLG
:: :.: : .:.:::. : .:::: . .: .: . ::: .. ::.:
CCDS82 ILLRYLGGIAPPDKSWKGALNVSYSIGPGFTGSDSF---RKVRMHVYNINKITRIYNVVG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 IIRGAVEPDRYVLYGNHRDSWVHGAVDPSSGTAVLLELSRVLGTLLKKGTWRPRRSIVFA
:::.:::::::. :.:::::: ::.::.::.::: :..: .: :..:: :::::.:.::
CCDS82 TIRGSVEPDRYVILGGHRDSWVFGAIDPTSGVAVLQEIARSFGKLMSKG-WRPRRTIIFA
360 370 380 390 400
420 430 440 450 460 470
pF1KE0 SWGAEEFGLIGSTEFTEEFFNKLQERTVAYINVDISVFANATLRVQGTPPVQSVVFSATK
:: ::::::.::::..:: . ::::..:::: : :. .: ::::. :: . ..:.. ::
CCDS82 SWDAEEFGLLGSTEWAEENVKILQERSIAYINSDSSIEGNYTLRVDCTPLLYQLVYKLTK
410 420 430 440 450 460
480 490 500 510 520
pF1KE0 EIRSPGPG--DLSIYDNWIRYFNRSSPVYGLVPSLGSLGAGSDYAPFVHFLGISSMDIAY
:: :: : . :.:..:.. . :: .: ...::.:::. . . :::.: :
CCDS82 EIPSPDDGFESKSLYESWLE--KDPSPENKNLPRINKLGSGSDFEAYFQRLGIASGRARY
470 480 490 500 510 520
530 540 550 560 570 580
pF1KE0 TYDRSKTSARIYPTYHTAFDTFDYVDKFLDPGFSSHQAVARTAGSVILRLSDSFFLPLKV
: ... . ::.::: ..::. :.:: :: :... .::. :... .: :: ..:...
CCDS82 TKNKKTDKYSSYPVYHTIYETFELVEKFYDPTFKKQLSVAQLRGALVYELVDSKIIPFNI
530 540 550 560 570 580
590 600 610 620 630 640
pF1KE0 SDYSETLRSFLQAAQQDLGALLEQ----HSISLGPLVTAVEKFEAEAAALGQRISTLQKG
.::.:.:... :. .:. .: :..:. : .::..: :. . .:. .:
CCDS82 QDYAEALKNY-AASIYNLSKKHDQQLTDHGVSFDSLFSAVKNFSEAASDFHKRL--IQVD
590 600 610 620 630 640
650 660 670 680 690 700
pF1KE0 SPDPLQVRMLNDQLMLLERTFLNPRAFPEERYYSHVLWAPRTGSVV---TFPGLSNACSR
.:. :::.:::::::::.:..: ..: . .: :...:: . . .:::. .:
CCDS82 LNNPIAVRMMNDQLMLLERAFIDPLGLPGKLFYRHIIFAPSSHNKYAGESFPGIYDAIFD
650 660 670 680 690 700
710 720 730 740
pF1KE0 ARDTASGSEAWAEVQRQLSIVVTALEGAAATLRPVADL
.. :.. :: ::....::.. ....::.::. :
CCDS82 IENKANSRLAWKEVKKHISIAAFTIQAAAGTLKEVL
710 720 730 740
>>CCDS31493.1 FOLH1 gene_id:2346|Hs108|chr11 (719 aa)
initn: 952 init1: 535 opt: 1506 Z-score: 1630.6 bits: 312.3 E(32554): 1.7e-84
Smith-Waterman score: 1556; 36.4% identity (66.7% similar) in 751 aa overlap (2-738:19-719)
10 20 30 40
pF1KE0 MQWTKVLGLGLGAAALLGLGIILGHFAIPK-KANSLAPQDLDL
.: . .: : :.... ::...: : . .:....:.
CCDS31 MWNLLHETDSAVATARRPRWLCAGALVL-AGGFFLLGFLFGWFIKSSNEATNITPK----
10 20 30 40 50
50 60 70 80 90 100
pF1KE0 EILETVMGQLDAHRIRENLRELSREPHLASSPRDEDLVQLLLQRWKDPESGLDSAEASTY
. ... . .: :. :.. : .... ::::.. .. .:.. . ..:: : ::::.: . :
CCDS31 HNMKAFLDELKAENIKKFLYNFTQIPHLAGTEQNFQLAKQIQSQWK--EFGLDSVELAHY
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE0 EVLLSFPSQEQPNVVDIVGPTGGIIHSCHRTEENVTGEQGGPDVVQPYAAYAPSGTPQGL
.::::.:.. .:: ..:.. :. : . : : .. :.: :..:..:.: :.:
CCDS31 DVLLSYPNKTHPNYISIINEDGNEIFNTSLFEPPPPGYENVSDIVPPFSAFSPQGMPEGD
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE0 LVYANRGAEEDFKELQTQ-GIKLEGTIALTRYGGVGRGAKAVNAAKHGVAGVLVYTDPAD
:::.: . ::: .:. . :. : :...::: : :: :. :: :. ::..:.::::
CCDS31 LVYVNYARTEDFFKLERDMKINCSGKIVIARYGKVFRGNKVKNAQLAGAKGVILYSDPAD
180 190 200 210 220 230
230 240 250 260 270
pF1KE0 -INDGLSSPDETFPNSWYLPPSGVERGSYYEY--FGDPLTPYLPAVPSSFRVDLANVSGF
. :..: .:..: :: .::.::. . :::::: :: ..: .:.. :.
CCDS31 YFAPGVKS----YPDGWNLPGGGVQRGNILNLNGAGDPLTPGYPANEYAYRRGIAEAVGL
240 250 260 270 280
280 290 300 310 320 330
pF1KE0 PPIPTQPIGFQDARDLLCNLNGTLAP-ATWQGALGCHYRLGPGFRPDGDFPADSQVNVSV
: ::..:::. ::. :: ...:. : ..:.:.: : .:::: :.: . ..:.. .
CCDS31 PSIPVHPIGYYDAQKLLEKMGGSAPPDSSWRGSLKVPYNVGPGF--TGNF-STQKVKMHI
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE0 YNRLELRNSSNVLGIIRGAVEPDRYVLYGNHRDSWVHGAVDPSSGTAVLLELSRVLGTLL
.. :. ::.: .::::::::::. :.:::::: :..::.::.::. :. : .:::
CCDS31 HSTNEVTRIYNVIGTLRGAVEPDRYVILGGHRDSWVFGGIDPQSGAAVVHEIVRSFGTLK
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE0 KKGTWRPRRSIVFASWGAEEFGLIGSTEFTEEFFNKLQERTVAYINVDISVFANATLRVQ
:.: :::::.:.:::: ::::::.::::..:: :::: :::::.: :. .: ::::.
CCDS31 KEG-WRPRRTILFASWDAEEFGLLGSTEWAEENSRLLQERGVAYINADSSIEGNYTLRVD
410 420 430 440 450 460
460 470 480 490 500 510
pF1KE0 GTPPVQSVVFSATKEIRSPGPG--DLSIYDNWIRYFNRSSPVYGLVPSLGSLGAGSDYAP
:: . :.: . :::..:: : :.:..: . . :: .. .: ...::.:.:.
CCDS31 CTPLMYSLVHNLTKELKSPDEGFEGKSLYESWTK--KSPSPEFSGMPRISKLGSGNDFEV
470 480 490 500 510 520
520 530 540 550 560 570
pF1KE0 FVHFLGISSMDIAYTYDRSKTSARIYPTYHTAFDTFDYVDKFLDPGFSSHQAVARTAGSV
: . :::.: :: . .. :: ::....:.. :.:: :: :. : .::.. :..
CCDS31 FFQRLGIASGRARYTKNWETNKFSGYPLYHSVYETYELVEKFYDPMFKYHLTVAQVRGGM
530 540 550 560 570 580
580 590 600 610 620 630
pF1KE0 ILRLSDSFFLPLKVSDYSETLRSF---LQAAQQDLGALLEQHSISLGPLVTAVEKFEAEA
...:..:. ::. ::. .::.. . . .. .. .:.:. : .::..: :
CCDS31 VFELANSIVLPFDCRDYAVVLRKYADKIYSISMKHPQEMKTYSVSFDSLFSAVKNFTEIA
590 600 610 620 630 640
640 650 660 670 680 690
pF1KE0 AALGQRISTLQKGSPDPLQVRMLNDQLMLLERTFLNPRAFPEERYYSHVLWAPRTGSVV-
. ...:.. ..:.. ::..:: . .
CCDS31 SKFSERLQDFDKSK---------------------------------HVIYAPSSHNKYA
650 660 670
700 710 720 730 740
pF1KE0 --TFPGLSNACSRARDTASGSEAWAEVQRQLSIVVTALEGAAATLRPVADL
.:::. .: .. .. :.::.::.::. ... ....:: :: ::
CCDS31 GESFPGIYDALFDIESKVDPSKAWGEVKRQIYVAAFTVQAAAETLSEVA
680 690 700 710
>>CCDS53627.1 FOLH1 gene_id:2346|Hs108|chr11 (704 aa)
initn: 906 init1: 535 opt: 1495 Z-score: 1618.8 bits: 310.1 E(32554): 7.6e-84
Smith-Waterman score: 1544; 36.8% identity (66.3% similar) in 745 aa overlap (9-738:9-704)
10 20 30 40 50
pF1KE0 MQWTKVLGLGLGAAALLG-LGIILGHFAIPK-KANSLAPQDLDLEILETVMGQLDAHRIR
: :.: : : :. :: : . .:....:. . ... . .: :. :.
CCDS53 MTAGSSYPLFLAAYACTGCLAERLGWFIKSSNEATNITPK----HNMKAFLDELKAENIK
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 ENLRELSREPHLASSPRDEDLVQLLLQRWKDPESGLDSAEASTYEVLLSFPSQEQPNVVD
. : .... ::::.. .. .:.. . ..:: : ::::.: . :.::::.:.. .:: ..
CCDS53 KFLYNFTQIPHLAGTEQNFQLAKQIQSQWK--EFGLDSVELAHYDVLLSYPNKTHPNYIS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 IVGPTGGIIHSCHRTEENVTGEQGGPDVVQPYAAYAPSGTPQGLLVYANRGAEEDFKELQ
:.. :. : . : : .. :.: :..:..:.: :.: :::.: . ::: .:.
CCDS53 IINEDGNEIFNTSLFEPPPPGYENVSDIVPPFSAFSPQGMPEGDLVYVNYARTEDFFKLE
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 TQ-GIKLEGTIALTRYGGVGRGAKAVNAAKHGVAGVLVYTDPAD-INDGLSSPDETFPNS
. :. : :...::: : :: :. :: :. ::..:.:::: . :..: .:..
CCDS53 RDMKINCSGKIVIARYGKVFRGNKVKNAQLAGAKGVILYSDPADYFAPGVKS----YPDG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 WYLPPSGVERGSYYEY--FGDPLTPYLPAVPSSFRVDLANVSGFPPIPTQPIGFQDARDL
: :: .::.::. . :::::: :: ..: .:.. :.: ::..:::. ::. :
CCDS53 WNLPGGGVQRGNILNLNGAGDPLTPGYPANEYAYRRGIAEAVGLPSIPVHPIGYYDAQKL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 LCNLNGTLAP-ATWQGALGCHYRLGPGFRPDGDFPADSQVNVSVYNRLELRNSSNVLGII
: ...:. : ..:.:.: : .:::: :.: . ..:.. ... :. ::.: .
CCDS53 LEKMGGSAPPDSSWRGSLKVPYNVGPGFT--GNF-STQKVKMHIHSTNEVTRIYNVIGTL
300 310 320 330 340
360 370 380 390 400 410
pF1KE0 RGAVEPDRYVLYGNHRDSWVHGAVDPSSGTAVLLELSRVLGTLLKKGTWRPRRSIVFASW
::::::::::. :.:::::: :..::.::.::. :. : .::: :.: :::::.:.::::
CCDS53 RGAVEPDRYVILGGHRDSWVFGGIDPQSGAAVVHEIVRSFGTLKKEG-WRPRRTILFASW
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE0 GAEEFGLIGSTEFTEEFFNKLQERTVAYINVDISVFANATLRVQGTPPVQSVVFSATKEI
::::::.::::..:: :::: :::::.: :. .: ::::. :: . :.: . :::.
CCDS53 DAEEFGLLGSTEWAEENSRLLQERGVAYINADSSIEGNYTLRVDCTPLMYSLVHNLTKEL
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE0 RSPGPG--DLSIYDNWIRYFNRSSPVYGLVPSLGSLGAGSDYAPFVHFLGISSMDIAYTY
.:: : :.:..: . . :: .. .: ...::.:.:. : . :::.: ::
CCDS53 KSPDEGFEGKSLYESWTK--KSPSPEFSGMPRISKLGSGNDFEVFFQRLGIASGRARYTK
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE0 DRSKTSARIYPTYHTAFDTFDYVDKFLDPGFSSHQAVARTAGSVILRLSDSFFLPLKVSD
. .. :: ::....:.. :.:: :: :. : .::.. :.....:..:. ::. :
CCDS53 NWETNKFSGYPLYHSVYETYELVEKFYDPMFKYHLTVAQVRGGMVFELANSIVLPFDCRD
530 540 550 560 570 580
600 610 620 630 640
pF1KE0 YSETLRSF---LQAAQQDLGALLEQHSISLGPLVTAVEKFEAEAAALGQRISTLQKGSPD
:. .::.. . . .. .. .:.:. : .::..: :. ...:.. ..:..
CCDS53 YAVVLRKYADKIYSISMKHPQEMKTYSVSFDSLFSAVKNFTEIASKFSERLQDFDKSK--
590 600 610 620 630 640
650 660 670 680 690 700
pF1KE0 PLQVRMLNDQLMLLERTFLNPRAFPEERYYSHVLWAPRTGSVV---TFPGLSNACSRARD
::..:: . . .:::. .: ..
CCDS53 -------------------------------HVIYAPSSHNKYAGESFPGIYDALFDIES
650 660 670
710 720 730 740
pF1KE0 TASGSEAWAEVQRQLSIVVTALEGAAATLRPVADL
.. :.::.::.::. ... ....:: :: ::
CCDS53 KVDPSKAWGEVKRQIYVAAFTVQAAAETLSEVA
680 690 700
>>CCDS53626.1 FOLH1 gene_id:2346|Hs108|chr11 (442 aa)
initn: 658 init1: 535 opt: 1135 Z-score: 1231.9 bits: 237.8 E(32554): 2.7e-62
Smith-Waterman score: 1135; 40.2% identity (72.0% similar) in 450 aa overlap (298-738:1-442)
270 280 290 300 310 320
pF1KE0 FRVDLANVSGFPPIPTQPIGFQDARDLLCNLNGTLAP-ATWQGALGCHYRLGPGFRPDGD
..:. : ..:.:.: : .:::: :.
CCDS53 MGGSAPPDSSWRGSLKVPYNVGPGFT--GN
10 20
330 340 350 360 370 380
pF1KE0 FPADSQVNVSVYNRLELRNSSNVLGIIRGAVEPDRYVLYGNHRDSWVHGAVDPSSGTAVL
: . ..:.. ... :. ::.: .::::::::::. :.:::::: :..::.::.::.
CCDS53 F-STQKVKMHIHSTNEVTRIYNVIGTLRGAVEPDRYVILGGHRDSWVFGGIDPQSGAAVV
30 40 50 60 70 80
390 400 410 420 430 440
pF1KE0 LELSRVLGTLLKKGTWRPRRSIVFASWGAEEFGLIGSTEFTEEFFNKLQERTVAYINVDI
:. : .::: :.: :::::.:.:::: ::::::.::::..:: :::: :::::.:
CCDS53 HEIVRSFGTLKKEG-WRPRRTILFASWDAEEFGLLGSTEWAEENSRLLQERGVAYINADS
90 100 110 120 130 140
450 460 470 480 490 500
pF1KE0 SVFANATLRVQGTPPVQSVVFSATKEIRSPGPG--DLSIYDNWIRYFNRSSPVYGLVPSL
:. .: ::::. :: . :.: . :::..:: : :.:..: . . :: .. .: .
CCDS53 SIEGNYTLRVDCTPLMYSLVHNLTKELKSPDEGFEGKSLYESWTK--KSPSPEFSGMPRI
150 160 170 180 190 200
510 520 530 540 550 560
pF1KE0 GSLGAGSDYAPFVHFLGISSMDIAYTYDRSKTSARIYPTYHTAFDTFDYVDKFLDPGFSS
..::.:.:. : . :::.: :: . .. :: ::....:.. :.:: :: :.
CCDS53 SKLGSGNDFEVFFQRLGIASGRARYTKNWETNKFSGYPLYHSVYETYELVEKFYDPMFKY
210 220 230 240 250 260
570 580 590 600 610 620
pF1KE0 HQAVARTAGSVILRLSDSFFLPLKVSDYSETLRSF---LQAAQQDLGALLEQHSISLGPL
: .::.. :.....:..:. ::. ::. .::.. . . .. .. .:.:. :
CCDS53 HLTVAQVRGGMVFELANSIVLPFDCRDYAVVLRKYADKIYSISMKHPQEMKTYSVSFDSL
270 280 290 300 310 320
630 640 650 660 670 680
pF1KE0 VTAVEKFEAEAAALGQRISTLQKGSPDPLQVRMLNDQLMLLERTFLNPRAFPEERYYSHV
.::..: :. ...:.. ..:. .:. .::.:::::.:::.:..: ..:.. .: ::
CCDS53 FSAVKNFTEIASKFSERLQDFDKS--NPIVLRMMNDQLMFLERAFIDPLGLPDRPFYRHV
330 340 350 360 370 380
690 700 710 720 730
pF1KE0 LWAPRTGSVV---TFPGLSNACSRARDTASGSEAWAEVQRQLSIVVTALEGAAATLRPVA
..:: . . .:::. .: .. .. :.::.::.::. ... ....:: :: ::
CCDS53 IYAPSSHNKYAGESFPGIYDALFDIESKVDPSKAWGEVKRQIYVAAFTVQAAAETLSEVA
390 400 410 420 430 440
740
pF1KE0 DL
>>CCDS73364.1 NAALAD2 gene_id:10003|Hs108|chr11 (707 aa)
initn: 1155 init1: 544 opt: 1099 Z-score: 1189.6 bits: 230.7 E(32554): 6.1e-60
Smith-Waterman score: 1575; 37.3% identity (65.5% similar) in 740 aa overlap (13-737:15-706)
10 20 30 40 50
pF1KE0 MQWTKVLGLGLGAAALLG--LGIILGHFAIPKKANSLAPQDLDLEILETVMGQLDAHR
:::: . .:...: : : : .. . . : ..... :.
CCDS73 MAESRGRLYLWMCLAAALASFLMGFMVGWFIKPLKETTTSVR-YHQSIRWKLVSEMKAEN
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 IRENLRELSREPHLASSPRDEDLVQLLLQRWKDPESGLDSAEASTYEVLLSFPSQEQPNV
:. :: ... ::::.. .. :.. . .:: . :::::. :.::::.:.. . :
CCDS73 IKSFLRSFTKLPHLAGTEQNFLLAKKIQTQWK--KFGLDSAKLVHYDVLLSYPNETNANY
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 VDIVGPTGGIIHSCHRTEENVTGEQGGPDVVQPYAAYAPSGTPQGLLVYANRGAEEDFKE
..:: : . : : .. ..: :: :.. .: :.: :::.: . ::: .
CCDS73 ISIVDEHETEIFKTSYLEPPPDGYENVTNIVPPYNAFSAQGMPEGDLVYVNYARTEDFFK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 LQTQ-GIKLEGTIALTRYGGVGRGAKAVNAAKHGVAGVLVYTDPADINDGLSSPD-ETFP
:. . ::. : :...::: . :: :. :: :. :...:.:::: .:. . .:
CCDS73 LEREMGINCTGKIVIARYGKIFRGNKVKNAMLAGAIGIILYSDPADY----FAPEVQPYP
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 NSWYLPPSGVERGSYYEY--FGDPLTPYLPAVPSSFRVDLANVSGFPPIPTQPIGFQDAR
..: :: ....::. . :::::: :: .::.:. . :.: ::..:::..::.
CCDS73 KGWNLPGTAAQRGNVLNLNGAGDPLTPGYPAKEYTFRLDVEEGVGIPRIPVHPIGYNDAE
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 DLLCNLNGTLAPATWQGALGCHYRLGPGFRPDGDFPADSQVNVSVYNRLELRNSSNVLGI
:: .: . ::: .. ::.:
CCDS73 ILL-----------------------------------RKVRMHVYNINKITRIYNVVGT
300 310
360 370 380 390 400 410
pF1KE0 IRGAVEPDRYVLYGNHRDSWVHGAVDPSSGTAVLLELSRVLGTLLKKGTWRPRRSIVFAS
:::.:::::::. :.:::::: ::.::.::.::: :..: .: :..:: :::::.:.:::
CCDS73 IRGSVEPDRYVILGGHRDSWVFGAIDPTSGVAVLQEIARSFGKLMSKG-WRPRRTIIFAS
320 330 340 350 360 370
420 430 440 450 460 470
pF1KE0 WGAEEFGLIGSTEFTEEFFNKLQERTVAYINVDISVFANATLRVQGTPPVQSVVFSATKE
: ::::::.::::..:: . ::::..:::: : :. .: ::::. :: . ..:.. :::
CCDS73 WDAEEFGLLGSTEWAEENVKILQERSIAYINSDSSIEGNYTLRVDCTPLLYQLVYKLTKE
380 390 400 410 420 430
480 490 500 510 520 530
pF1KE0 IRSPGPG--DLSIYDNWIRYFNRSSPVYGLVPSLGSLGAGSDYAPFVHFLGISSMDIAYT
: :: : . :.:..:.. . :: .: ...::.:::. . . :::.: ::
CCDS73 IPSPDDGFESKSLYESWLE--KDPSPENKNLPRINKLGSGSDFEAYFQRLGIASGRARYT
440 450 460 470 480 490
540 550 560 570 580 590
pF1KE0 YDRSKTSARIYPTYHTAFDTFDYVDKFLDPGFSSHQAVARTAGSVILRLSDSFFLPLKVS
... . ::.::: ..::. :.:: :: :... .::. :... .: :: ..:....
CCDS73 KNKKTDKYSSYPVYHTIYETFELVEKFYDPTFKKQLSVAQLRGALVYELVDSKIIPFNIQ
500 510 520 530 540 550
600 610 620 630 640
pF1KE0 DYSETLRSFLQAAQQDLGALLEQ----HSISLGPLVTAVEKFEAEAAALGQRISTLQKGS
::.:.:... :. .:. .: :..:. : .::..: :. . .:. .:
CCDS73 DYAEALKNY-AASIYNLSKKHDQQLTDHGVSFDSLFSAVKNFSEAASDFHKRL--IQVDL
560 570 580 590 600 610
650 660 670 680 690 700
pF1KE0 PDPLQVRMLNDQLMLLERTFLNPRAFPEERYYSHVLWAPRTGSVV---TFPGLSNACSRA
.:. :::.:::::::::.:..: ..: . .: :...:: . . .:::. .:
CCDS73 NNPIAVRMMNDQLMLLERAFIDPLGLPGKLFYRHIIFAPSSHNKYAGESFPGIYDAIFDI
620 630 640 650 660 670
710 720 730 740
pF1KE0 RDTASGSEAWAEVQRQLSIVVTALEGAAATLRPVADL
.. :.. :: ::....::.. ....::.::. :
CCDS73 ENKANSRLAWKEVKKHISIAAFTIQAAAGTLKEVL
680 690 700
>>CCDS34707.1 TFR2 gene_id:7036|Hs108|chr7 (801 aa)
initn: 745 init1: 193 opt: 413 Z-score: 445.4 bits: 93.2 E(32554): 1.7e-18
Smith-Waterman score: 930; 29.7% identity (60.9% similar) in 690 aa overlap (52-734:148-790)
30 40 50 60 70 80
pF1KE0 ILGHFAIPKKANSLAPQDLDLEILETVMGQLDAHRIRENLRELSREPHLASSPRDEDLVQ
: :.....:. : . ..:.: :.:
CCDS34 VSEDVNYEPDLDFHQGRLYWSDLQAMFLQFLGEGRLEDTIRQTSLRERVAGSAGMAALTQ
120 130 140 150 160 170
90 100 110 120 130 140
pF1KE0 LLLQRWKDPESGLDSAEASTYEVLLSFPSQEQPNVVDIVGPTGGIIHSCHRTEENVTGEQ
. : .. :: . ..:. : :.::. .::.. : .: .. :.. :.
CCDS34 DI--RAALSRQKLDHVWTDTHYVGLQFPDPAHPNTLHWVDEAG-------KVGEQLPLED
180 190 200 210 220
150 160 170 180 190 200
pF1KE0 GGPDVVQPYAAYAPSGTPQGLLVYANRGAEEDFKELQTQGIKLEGTIALTRYGGVGRGAK
::: ::.: :. : ::::. : ::...:...:. : . :.: : .. . :
CCDS34 --PDVYCPYSAI---GNVTGELVYAHYGRPEDLQDLRARGVDPVGRLLLVRVGVISFAQK
230 240 250 260 270 280
210 220 230 240 250 260
pF1KE0 AVNAAKHGVAGVLVYTDPADINDGLSSPDETFPNSWYLPPSGVERGSYYEYFGDPLTPYL
..:: :. :::.: .:::... .:. . .. : . :. :. ::: :: .
CCDS34 VTNAQDFGAQGVLIYPEPADFSQDPPKPSLSSQQAVY---GHVHLGT-----GDPYTPGF
290 300 310 320 330
270 280 290 300 310 320
pF1KE0 PAVPSSFRVDLANVSGFPPIPTQPIGFQDARDLLCNLNGTLAPATWQGAL-GCHYRLGPG
:. .. .:. ::.: ::.:::. . : :: .:.: .:: :::.: : :.::::
CCDS34 PSFNQTQFPPVAS-SGLPSIPAQPISADIASRLLRKLKGPVAPQEWQGSLLGSPYHLGPG
340 350 360 370 380 390
330 340 350 360 370 380
pF1KE0 FRPDGDFPADSQVNVSVYNRLELRNSSNVLGIIRGAVEPDRYVLYGNHRDSWVHGAVDPS
: . . : :. .:..: :.: :::.::. : .::.: ::. .
CCDS34 PR----------LRLVVNNHRTSTPINNIFGCIEGRSEPDHYVVIGAQRDAWGPGAAKSA
400 410 420 430 440
390 400 410 420 430 440
pF1KE0 SGTAVLLELSRVLGTLLKKGTWRPRRSIVFASWGAEEFGLIGSTEFTEEFFNKLQERTVA
:::.:::: :........: .:::::..: :: . .:: .::::. : ... :. ..:.
CCDS34 VGTAILLELVRTFSSMVSNG-FRPRRSLLFISWDGGDFGSVGSTEWLEGYLSVLHLKAVV
450 460 470 480 490 500
450 460 470 480 490 500
pF1KE0 YINVDISVFANATLRVQGTPPVQSVVFSATKEIRSPGPGDLSIYDNWIRYFNRSSPVYGL
:...: .:... .... .: . :.. :. :.. ::. . ..:.. . . : : . .
CCDS34 YVSLDNAVLGDDKFHAKTSPLLTSLIESVLKQVDSPNHSGQTLYEQ-VVFTNPSWDAEVI
510 520 530 540 550 560
510 520 530 540 550 560
pF1KE0 VPSLGSLGAGSDYAPFVHFLGISSMDIAYTYDRSKTSARIYPTYHTAFDTFDYVDKFLDP
: : :. :. :.:. ...... : . :: :: ::.. . : :.
CCDS34 RP----LPMDSSAYSFTAFVGVPAVEFSFMEDD-----QAYPFLHTKEDTYENLHKVLQG
570 580 590 600 610
570 580 590 600 610
pF1KE0 GFSS-HQAVARTAGSVILRLSDSFFLPLKVSDYSETLRSFLQAAQQDLGALLEQHSISLG
. . ::::. ::....::: . .::: . :.... . . ..... :. ....:
CCDS34 RLPAVAQAVAQLAGQLLIRLSHDRLLPLDFGRYGDVVLRHI-GNLNEFSGDLKARGLTLQ
620 630 640 650 660 670
620 630 640 650 660 670
pF1KE0 PLVTAVEKFEAEAAALGQRISTLQKGSPDPLQVRMLNDQLMLLERTFLNPRAFPEERYYS
. .: . : : :.: . .. : .:: : ..: .: ::. . : . .
CCDS34 WVYSARGDYIRAAEKLRQEIYSSEER--DERLTRMYNVRIMRVEFYFLSQYVSPADSPFR
680 690 700 710 720 730
680 690 700 710 720 730
pF1KE0 HVLWA---PRTGSVVTFPGLSNACSRARDTASGSEAWAE--VQRQLSIVVTALEGAAATL
:.. . :... : . : . :..: .. : .:::.... .:.::: .:
CCDS34 HIFMGRGDHTLGALLDHLRLLRSNSSGTPGATSSTGFQESRFRRQLALLTWTLQGAANAL
740 750 760 770 780 790
740
pF1KE0 RPVADL
CCDS34 SGDVWNIDNNF
800
>>CCDS82891.1 TFRC gene_id:7037|Hs108|chr3 (679 aa)
initn: 619 init1: 363 opt: 381 Z-score: 411.9 bits: 86.7 E(32554): 1.3e-16
Smith-Waterman score: 761; 27.4% identity (59.7% similar) in 675 aa overlap (61-734:66-668)
40 50 60 70 80 90
pF1KE0 KANSLAPQDLDLEILETVMGQLDAHRIRENLRELSREPHLASSPRDEDLVQLLLQRWKDP
: : : :. :.: .::.:. . ....
CCDS82 PAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREAGSQKDENLALYVENQFR--
40 50 60 70 80 90
100 110 120 130 140 150
pF1KE0 ESGLDSAEASTYEVLLSFPSQEQPNVVDIVGPTGGIIHSCHRTEENVTGEQGGPDVVQPY
: :... . . : .. .. : .:. :: .: ... :: :: :
CCDS82 EFKLSKVWRDQHFVKIQVKDSAQNSVI-IVDKNGRLVY----LVEN----PGG------Y
100 110 120 130
160 170 180 190 200 210
pF1KE0 AAYAPSGTPQGLLVYANRGAEEDFKELQTQGIKLEGTIALTRYGGVGRGAKAVNAAKHGV
.::. ..: : ::.:: :...::..: : ..:.:...: : . . :..:: . ..
CCDS82 VAYSKAATVTGKLVHANFGTKKDFEDLYTP---VNGSIVIVRAGKITFAEKVANAESLNA
140 150 160 170 180 190
220 230 240 250 260 270
pF1KE0 AGVLVYTDPADINDGLSSPDETFPNSWYLPPSGVERGSYYEYFGDPLTPYLPAVPSSFRV
:::.: : . . . . . .: . .: :. ::: :: .:. . .
CCDS82 IGVLIYMDQTKFP--IVNAELSFFGHAHL-------GT-----GDPYTPGFPSFNHT-QF
200 210 220 230 240
280 290 300 310 320 330
pF1KE0 DLANVSGFPPIPTQPIGFQDARDLLCNLNGTLAPATWQGALGCHYRLGPGFRPDGDFPAD
. ::.: ::.: :. :. :. :..: :. :. :.. . .
CCDS82 PPSRSSGLPNIPVQTISRAAAEKLFGNMEGD-CPSDWKTDSTCRMVTSES----------
250 260 270 280
340 350 360 370 380 390
pF1KE0 SQVNVSVYNRLELRNSSNVLGIIRGAVEPDRYVLYGNHRDSWVHGAVDPSSGTAVLLELS
..:...: : :. . :..:.:.: ::::.::. : .::.: ::. . :::.::.:.
CCDS82 KNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPGAAKSGVGTALLLKLA
290 300 310 320 330 340
400 410 420 430 440 450
pF1KE0 RVLGTLLKKGTWRPRRSIVFASWGAEEFGLIGSTEFTEEFFNKLQERTVAYINVDISVFA
.... .. : ..: :::.::::.: .:: .:.::. : ....:. .. .:::.: .:..
CCDS82 QMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLHLKAFTYINLDKAVLG
350 360 370 380 390 400
460 470 480 490 500
pF1KE0 NATLRVQGTPPVQSVVFSATKEIRSPGPGDLSIYD-NWIRYFNRSSPVYGLVPSLGSLGA
.....:...: . ... .. .... : :.. : :: .: : :. . ...
CCDS82 TSNFKVSASPLLYTLIEKTMQNVKHPVTGQFLYQDSNW------ASKVEKLTLDNAAF--
410 420 430 440 450 460
510 520 530 540 550 560
pF1KE0 GSDYAPFVHFLGISSMDIAYTYDRSKTSARIYPTYHTAFDTFDYVDKFLDPGFSSHQAVA
::. . :: .... . : . :: :..::. . . . . .:.:
CCDS82 -----PFLAYSGIPAVSFCFCEDTD------YPYLGTTMDTYKELIERIPELNKVARAAA
470 480 490 500 510
570 580 590 600 610 620
pF1KE0 RTAGSVILRLSDSFFLPLKVSDYSETLRSFLQAAQQDLGALLEQHSISLGPLVTAVEKFE
..::. ...:. . : : :. : ::.. .: : ... ..:: : .: :
CCDS82 EVAGQFVIKLTHDVELNLDYERYNSQLLSFVRDLNQ-YRADIKEMGLSLQWLYSARGDFF
520 530 540 550 560
630 640 650 660 670 680
pF1KE0 AEAAALGQRISTLQKGSPDPLQVRMLNDQLMLLERTFLNPRAFPEERYYSHVLWAPRTGS
.. : ... .: : . .. :::..: .: ::.: . :.: . ::.:. .::
CCDS82 RATSRLTTDFGNAEK--TDRFVMKKLNDRVMRVEYHFLSPYVSPKESPFRHVFWG--SGS
570 580 590 600 610 620
690 700 710 720 730 740
pF1KE0 VVTFPGLSNACSRARDTASGSEAWAEVQRQLSIVVTALEGAAATLRPVADL
:.:.: . . : .:. . . ::.... ...::: .:
CCDS82 H-TLPALLENL-KLRKQNNGAFNETLFRNQLALATWTIQGAANALSGDVWDIDNEF
630 640 650 660 670
740 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 06:45:19 2016 done: Fri Nov 4 06:45:20 2016
Total Scan time: 3.640 Total Display time: 0.200
Function used was FASTA [36.3.4 Apr, 2011]