FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4088, 760 aa
1>>>pF1KB4088 760 - 760 aa - 760 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5393+/-0.00112; mu= 19.0666+/- 0.067
mean_var=72.4283+/-14.248, 0's: 0 Z-trim(102.8): 19 B-trim: 0 in 0/49
Lambda= 0.150702
statistics sampled from 7116 (7131) to 7116 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.565), E-opt: 0.2 (0.219), width: 16
Scan time: 3.140
The best scores are: opt bits E(32554)
CCDS3312.1 TFRC gene_id:7037|Hs108|chr3 ( 760) 5024 1102.3 0
CCDS82891.1 TFRC gene_id:7037|Hs108|chr3 ( 679) 4492 986.6 0
CCDS34707.1 TFR2 gene_id:7036|Hs108|chr7 ( 801) 834 191.4 4.9e-48
CCDS46960.1 NAALADL2 gene_id:254827|Hs108|chr3 ( 795) 448 107.4 8.9e-23
CCDS8288.1 NAALAD2 gene_id:10003|Hs108|chr11 ( 740) 444 106.6 1.5e-22
CCDS73364.1 NAALAD2 gene_id:10003|Hs108|chr11 ( 707) 435 104.6 5.7e-22
CCDS53627.1 FOLH1 gene_id:2346|Hs108|chr11 ( 704) 427 102.8 1.9e-21
CCDS31493.1 FOLH1 gene_id:2346|Hs108|chr11 ( 719) 427 102.9 1.9e-21
CCDS53628.1 FOLH1 gene_id:2346|Hs108|chr11 ( 735) 427 102.9 2e-21
CCDS7946.1 FOLH1 gene_id:2346|Hs108|chr11 ( 750) 427 102.9 2e-21
CCDS31604.1 NAALADL1 gene_id:10004|Hs108|chr11 ( 740) 381 92.9 2e-18
CCDS53626.1 FOLH1 gene_id:2346|Hs108|chr11 ( 442) 373 91.0 4.4e-18
>>CCDS3312.1 TFRC gene_id:7037|Hs108|chr3 (760 aa)
initn: 5024 init1: 5024 opt: 5024 Z-score: 5899.6 bits: 1102.3 E(32554): 0
Smith-Waterman score: 5024; 100.0% identity (100.0% similar) in 760 aa overlap (1-760:1-760)
10 20 30 40 50 60
pF1KB4 MMDQARSAFSNLFGGEPLSYTRFSLARQVDGDNSHVEMKLAVDEEENADNNTKANVTKPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MMDQARSAFSNLFGGEPLSYTRFSLARQVDGDNSHVEMKLAVDEEENADNNTKANVTKPK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 RCSGSICYGTIAVIVFFLIGFMIGYLGYCKGVEPKTECERLAGTESPVREEPGEDFPAAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RCSGSICYGTIAVIVFFLIGFMIGYLGYCKGVEPKTECERLAGTESPVREEPGEDFPAAR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 RLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREAGSQKDENLALYVENQFREFKLSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREAGSQKDENLALYVENQFREFKLSK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 VWRDQHFVKIQVKDSAQNSVIIVDKNGRLVYLVENPGGYVAYSKAATVTGKLVHANFGTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VWRDQHFVKIQVKDSAQNSVIIVDKNGRLVYLVENPGGYVAYSKAATVTGKLVHANFGTK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 KDFEDLYTPVNGSIVIVRAGKITFAEKVANAESLNAIGVLIYMDQTKFPIVNAELSFFGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KDFEDLYTPVNGSIVIVRAGKITFAEKVANAESLNAIGVLIYMDQTKFPIVNAELSFFGH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 AHLGTGDPYTPGFPSFNHTQFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDCPSDWKTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AHLGTGDPYTPGFPSFNHTQFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDCPSDWKTD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 STCRMVTSESKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPGAAKSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 STCRMVTSESKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPGAAKSG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 VGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLHLKAFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLHLKAFT
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 YINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHPVTGQFLYQDSNWASKVEKLTLDNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 YINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHPVTGQFLYQDSNWASKVEKLTLDNA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 AFPFLAYSGIPAVSFCFCEDTDYPYLGTTMDTYKELIERIPELNKVARAAAEVAGQFVIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AFPFLAYSGIPAVSFCFCEDTDYPYLGTTMDTYKELIERIPELNKVARAAAEVAGQFVIK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 LTHDVELNLDYERYNSQLLSFVRDLNQYRADIKEMGLSLQWLYSARGDFFRATSRLTTDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LTHDVELNLDYERYNSQLLSFVRDLNQYRADIKEMGLSLQWLYSARGDFFRATSRLTTDF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 GNAEKTDRFVMKKLNDRVMRVEYHFLSPYVSPKESPFRHVFWGSGSHTLPALLENLKLRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GNAEKTDRFVMKKLNDRVMRVEYHFLSPYVSPKESPFRHVFWGSGSHTLPALLENLKLRK
670 680 690 700 710 720
730 740 750 760
pF1KB4 QNNGAFNETLFRNQLALATWTIQGAANALSGDVWDIDNEF
::::::::::::::::::::::::::::::::::::::::
CCDS33 QNNGAFNETLFRNQLALATWTIQGAANALSGDVWDIDNEF
730 740 750 760
>>CCDS82891.1 TFRC gene_id:7037|Hs108|chr3 (679 aa)
initn: 4492 init1: 4492 opt: 4492 Z-score: 5275.2 bits: 986.6 E(32554): 0
Smith-Waterman score: 4492; 100.0% identity (100.0% similar) in 679 aa overlap (82-760:1-679)
60 70 80 90 100 110
pF1KB4 TKANVTKPKRCSGSICYGTIAVIVFFLIGFMIGYLGYCKGVEPKTECERLAGTESPVREE
::::::::::::::::::::::::::::::
CCDS82 MIGYLGYCKGVEPKTECERLAGTESPVREE
10 20 30
120 130 140 150 160 170
pF1KB4 PGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREAGSQKDENLALYVEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 PGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREAGSQKDENLALYVEN
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB4 QFREFKLSKVWRDQHFVKIQVKDSAQNSVIIVDKNGRLVYLVENPGGYVAYSKAATVTGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 QFREFKLSKVWRDQHFVKIQVKDSAQNSVIIVDKNGRLVYLVENPGGYVAYSKAATVTGK
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB4 LVHANFGTKKDFEDLYTPVNGSIVIVRAGKITFAEKVANAESLNAIGVLIYMDQTKFPIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 LVHANFGTKKDFEDLYTPVNGSIVIVRAGKITFAEKVANAESLNAIGVLIYMDQTKFPIV
160 170 180 190 200 210
300 310 320 330 340 350
pF1KB4 NAELSFFGHAHLGTGDPYTPGFPSFNHTQFPPSRSSGLPNIPVQTISRAAAEKLFGNMEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 NAELSFFGHAHLGTGDPYTPGFPSFNHTQFPPSRSSGLPNIPVQTISRAAAEKLFGNMEG
220 230 240 250 260 270
360 370 380 390 400 410
pF1KB4 DCPSDWKTDSTCRMVTSESKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 DCPSDWKTDSTCRMVTSESKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDA
280 290 300 310 320 330
420 430 440 450 460 470
pF1KB4 WGPGAAKSGVGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 WGPGAAKSGVGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYL
340 350 360 370 380 390
480 490 500 510 520 530
pF1KB4 SSLHLKAFTYINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHPVTGQFLYQDSNWASK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 SSLHLKAFTYINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHPVTGQFLYQDSNWASK
400 410 420 430 440 450
540 550 560 570 580 590
pF1KB4 VEKLTLDNAAFPFLAYSGIPAVSFCFCEDTDYPYLGTTMDTYKELIERIPELNKVARAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 VEKLTLDNAAFPFLAYSGIPAVSFCFCEDTDYPYLGTTMDTYKELIERIPELNKVARAAA
460 470 480 490 500 510
600 610 620 630 640 650
pF1KB4 EVAGQFVIKLTHDVELNLDYERYNSQLLSFVRDLNQYRADIKEMGLSLQWLYSARGDFFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 EVAGQFVIKLTHDVELNLDYERYNSQLLSFVRDLNQYRADIKEMGLSLQWLYSARGDFFR
520 530 540 550 560 570
660 670 680 690 700 710
pF1KB4 ATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYVSPKESPFRHVFWGSGSHTLPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 ATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYVSPKESPFRHVFWGSGSHTLPA
580 590 600 610 620 630
720 730 740 750 760
pF1KB4 LLENLKLRKQNNGAFNETLFRNQLALATWTIQGAANALSGDVWDIDNEF
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 LLENLKLRKQNNGAFNETLFRNQLALATWTIQGAANALSGDVWDIDNEF
640 650 660 670
>>CCDS34707.1 TFR2 gene_id:7036|Hs108|chr7 (801 aa)
initn: 1452 init1: 470 opt: 834 Z-score: 975.9 bits: 191.4 E(32554): 4.9e-48
Smith-Waterman score: 1942; 45.2% identity (71.6% similar) in 726 aa overlap (68-760:84-801)
40 50 60 70 80 90
pF1KB4 MKLAVDEEENADNNTKANVTKPKRCSGSICYGTIAVIVFFLIGFMIGYLGYCKGVEPKTE
: .......: .:..::... .:
CCDS34 MELRGPEPLGSRPRQPNLIPWAAAGRRAAPYLVLTALLIFTGAFLLGYVAF-RGSCQACG
60 70 80 90 100 110
100 110 120 130 140 150
pF1KB4 CERLAGTESPVREEPGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREA
:. .:. : :: :: .: :::.::. . . : . ::. ..: : :
CCDS34 DSVLVVSED-VNYEPDLDFHQGR-LYWSDLQAMFLQFLGEGRLEDTIR---QTSLRERVA
120 130 140 150 160
160 170 180 190 200 210
pF1KB4 GSQKDENLALYVENQFREFKLSKVWRDQHFVKIQVKDSAQ-NSVIIVDKNGRLVYLV--E
:: :. .. . . ::..:: : :.: .: : :. :.. ::. :.. . :
CCDS34 GSAGMAALTQDIRAALSRQKLDHVWTDTHYVGLQFPDPAHPNTLHWVDEAGKVGEQLPLE
170 180 190 200 210 220
220 230 240 250 260 270
pF1KB4 NPGGYVAYSKAATVTGKLVHANFGTKKDFEDLYT----PVNGSIVIVRAGKITFAEKVAN
.: : :: ..:::.::.:..: .:..:: . :: : ...::.: :.::.::.:
CCDS34 DPDVYCPYSAIGNVTGELVYAHYGRPEDLQDLRARGVDPV-GRLLLVRVGVISFAQKVTN
230 240 250 260 270 280
280 290 300 310 320
pF1KB4 AESLNAIGVLIYMDQTKF------PIVNAELSFFGHAHLGTGDPYTPGFPSFNHTQFPPS
:....: ::::: . . : : .... . .::.::::::::::::::::.:::::
CCDS34 AQDFGAQGVLIYPEPADFSQDPPKPSLSSQQAVYGHVHLGTGDPYTPGFPSFNQTQFPPV
290 300 310 320 330 340
330 340 350 360 370 380
pF1KB4 RSSGLPNIPVQTISRAAAEKLFGNMEGDC-PSDWKTDSTCRMV-TSESKNVKLTVSNVLK
:::::.::.: :: : .:. ...: :..:. . . . ..:.:.:
CCDS34 ASSGLPSIPAQPISADIASRLLRKLKGPVAPQEWQGSLLGSPYHLGPGPRLRLVVNNHRT
350 360 370 380 390 400
390 400 410 420 430 440
pF1KB4 EIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPGAAKSGVGTALLLKLAQMFSDMVLKDGF
: :::: :.: :::::::.::::::::::::::.::::.::.:.. ::.:: ..::
CCDS34 STPINNIFGCIEGRSEPDHYVVIGAQRDAWGPGAAKSAVGTAILLELVRTFSSMV-SNGF
410 420 430 440 450 460
450 460 470 480 490 500
pF1KB4 QPSRSIIFASWSAGDFGSVGATEWLEGYLSSLHLKAFTYINLDKAVLGTSNFKVSASPLL
.: ::..: ::..:::::::.::::::::: ::::: .:..::.:::: ..:....::::
CCDS34 RPRRSLLFISWDGGDFGSVGSTEWLEGYLSVLHLKAVVYVSLDNAVLGDDKFHAKTSPLL
470 480 490 500 510 520
510 520 530 540 550
pF1KB4 YTLIEKTMQNVKHPV-TGQFLYQ-----DSNWASKVEK-LTLDNAAFPFLAYSGIPAVSF
.:::.....: : .:: ::. . .: ..: . : .:..:. : :. :.::: :
CCDS34 TSLIESVLKQVDSPNHSGQTLYEQVVFTNPSWDAEVIRPLPMDSSAYSFTAFVGVPAVEF
530 540 550 560 570 580
560 570 580 590 600 610
pF1KB4 CFCEDTD-YPYLGTTMDTYKELIERIP-ELNKVARAAAEVAGQFVIKLTHDVELNLDYER
: :: . ::.: : :::..: . . .: ::.:.:..:::..:.:.:: : ::. :
CCDS34 SFMEDDQAYPFLHTKEDTYENLHKVLQGRLPAVAQAVAQLAGQLLIRLSHDRLLPLDFGR
590 600 610 620 630 640
620 630 640 650 660 670
pF1KB4 YNSQLLSFVRDLNQYRADIKEMGLSLQWLYSARGDFFRATSRLTTDFGNAEKTDRFVMKK
:.. .: . .::.. .:.: ::.:::.::::::..::. .: .. ..:. :. . .
CCDS34 YGDVVLRHIGNLNEFSGDLKARGLTLQWVYSARGDYIRAAEKLRQEIYSSEERDERLTRM
650 660 670 680 690 700
680 690 700 710 720
pF1KB4 LNDRVMRVEYHFLSPYVSPKESPFRHVFWGSGSHTLPALLENLKLRKQNN----GA----
: :.::::..::: :::: .:::::.: : :.::: :::..:.: ..:. ::
CCDS34 YNVRIMRVEFYFLSQYVSPADSPFRHIFMGRGDHTLGALLDHLRLLRSNSSGTPGATSST
710 720 730 740 750 760
730 740 750 760
pF1KB4 -FNETLFRNQLALATWTIQGAANALSGDVWDIDNEF
:.:. :: :::: :::.::::::::::::.:::.:
CCDS34 GFQESRFRRQLALLTWTLQGAANALSGDVWNIDNNF
770 780 790 800
>>CCDS46960.1 NAALADL2 gene_id:254827|Hs108|chr3 (795 aa)
initn: 271 init1: 216 opt: 448 Z-score: 522.4 bits: 107.4 E(32554): 8.9e-23
Smith-Waterman score: 458; 22.1% identity (56.3% similar) in 687 aa overlap (45-702:101-734)
20 30 40 50 60 70
pF1KB4 GEPLSYTRFSLARQVDGDNSHVEMKLAVDEEENADNNTKANVTKPKRCSGSICYGTIAVI
.:..: :. . . :: ..:. .. ..
CCDS46 NQNLGHSETIDLNLDSIQPATSPKGRFQRLQEESDYITHYTRSAPKSNRCNFCH-VLKIL
80 90 100 110 120
80 90 100 110 120 130
pF1KB4 ----VFFLIGFMIGYLGYCKGVEPKTECERLAGTESPVREEPGEDFPAARRLYWDDLKRK
..:..:..::: : . :.: : . . : .: .:: . ::
CCDS46 CTATILFIFGILIGY--YVH-----TNCPSDAPSSGTV--DP--------QLYQEILKTI
130 140 150 160 170
140 150 160 170 180 190
pF1KB4 LSEKLDSTDFTGTIKLLNENSYVPREAGSQKDENLALYVENQFREFKLSKVWRDQHFVKI
.: . .. : . ..: . .. : ... ...:. . : : .. : .
CCDS46 QAEDIKKS-FRNLVQLYK----------NEDDMEISKKIKTQWTSLGLEDVQFVNYSVLL
180 190 200 210 220
200 210 220 230
pF1KB4 QVKDSAQNSVIIVDKNGRLVYLVENPGG--------------YVAYSKAATVTGKLVHAN
.. . ..: . ...:. . .: . :.::: .:. .... ..
CCDS46 DLPGPSPSTVTL-SSSGQCFHPNGQPCSEEARKDSSQDLLYSYAAYSAKGTLKAEVIDVS
230 240 250 260 270 280
240 250 260 270 280 290
pF1KB4 FGTKKDFEDLYT--PVNGSIVIVRAGKITFAEKVANAESLNAIGVLIYMDQTKFP-IVNA
.: :.. . :...:.... ::. . :... :. . :::.:.: .: ::
CCDS46 YGMADDLKRIRKIKNVTNQIALLKLGKLPLLYKLSSLEKAGFGGVLLYIDPCDLPKTVNP
290 300 310 320 330 340
300 310 320 330 340 350
pF1KB4 ELSFFGHAHLGTGDPYTPGFPSFNHTQFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDC
. : . ::: :::.:: ... : :::. : .. :: :: . ::... ..
CCDS46 SHDTFMVSLNPGGDPSTPGYPSVDES-FRQSRSN-LTSLLVQPISAPLVAKLISSPKART
350 360 370 380 390
360 370 380 390 400 410
pF1KB4 PSDWKTDSTCRMVTSESKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRD-AW
.. . :. .. ..: . :.. :..: : . :. : . :.. ::.:..::... :
CCDS46 KNE--ACSSLELPNNEIRVVSMQVQTVTKLKTVTNVVGFVMGLTSPDRYIIVGSHHHTAH
400 410 420 430 440 450
420 430 440 450 460 470
pF1KB4 GPGAAKSGVGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLS
. .. . . .::.. . . . . : : :..:.:.:.: ::.. ::..:. :: : . .
CCDS46 SYNGQEWASSTAIITAFIRALMSKV-KRGWRPDRTIVFCSWGGTAFGNIGSYEWGEDFKK
460 470 480 490 500 510
480 490 500 510 520 530
pF1KB4 SLHLKAFTYINLDKAVLGTSNFKVSASPLLYTLI-EKTMQNVKHPVTGQFLYQDSNWASK
:. .. .::.: . . :.:.. ::: : :. ::. : : . ..:
CCDS46 VLQKNVVAYISLHSPIRGNSSLYPVASPSLQQLVVEKNNFN----CTRRAQCPETN----
520 530 540 550 560
540 550 560 570 580
pF1KB4 VEKLTLDNAAFPFLAYSGIPAVSFCFCEDT---DYP-YLGTT-MDTYKELIERI-PELNK
. .. ... : :. . :.: :.: . :: . : .:. . ..: ::.. : .:
CCDS46 ISSIQIQGDADYFINHLGVPIVQFAY-EDIKTLEGPSFLSEARFSTRATKIEEMDPSFN-
570 580 590 600 610 620
590 600 610 620 630 640
pF1KB4 VARAAAEVAGQFVIKLTHDVELNLDYERYNSQLLSFVRDLNQYRADIKEMGLSLQWLYSA
. .. ....:. ....... : .. .. . .. . .. :.: :.
CCDS46 LHETITKLSGEVILQIANEPVLPFNALDIALEVQNNLKGDQPNTHQLLAMALRLR----E
630 640 650 660 670 680
650 660 670 680 690 700
pF1KB4 RGDFFRATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYVSPKESPFRHVFWGSG
...:.. .. . . :. : ::: .. .: :: . : . .:....
CCDS46 SAELFQSDEMRPANDPKERAPIRIRM--LNDILQDMEKSFLVKQAPP--GFYRNILYHLD
690 700 710 720 730
710 720 730 740 750 760
pF1KB4 SHTLPALLENLKLRKQNNGAFNETLFRNQLALATWTIQGAANALSGDVWDIDNEF
CCDS46 EKTSRFSILIEAWEHCKPLASNETLQEALSEVLNSINSAQVYFKAGLDVFKSVLDGKN
740 750 760 770 780 790
>>CCDS8288.1 NAALAD2 gene_id:10003|Hs108|chr11 (740 aa)
initn: 557 init1: 195 opt: 444 Z-score: 518.1 bits: 106.6 E(32554): 1.5e-22
Smith-Waterman score: 794; 26.6% identity (58.5% similar) in 751 aa overlap (72-749:16-736)
50 60 70 80 90 100
pF1KB4 VDEEENADNNTKANVTKPKRCSGSICYGTIAVIVFFLIGFMIGYLGYCKGVEPKTECERL
:... ::.:::.:.. ..: :
CCDS82 MAESRGRLYLWMCLAAALASFLMGFMVGWF-----IKPLKE----
10 20 30
110 120 130 140 150 160
pF1KB4 AGTESPVREEPGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREAGSQK
: . :: : .... :: .. . .. . .. ... .:. ::...
CCDS82 --TTTSVR-------------YHQSIRWKLVSEMKAENIKSFLRSFTK---LPHLAGTEQ
40 50 60 70
170 180 190 200 210
pF1KB4 DENLALYVENQFREFKLSKVWRDQHFVKIQV-KDSAQNSVIIVDKNGRLV----YLVENP
. :: ...:...: :... .. : .. ... : . :::.. . :: :
CCDS82 NFLLAKKIQTQWKKFGLDSAKLVHYDVLLSYPNETNANYISIVDEHETEIFKTSYLEPPP
80 90 100 110 120 130
220 230 240 250 260
pF1KB4 GGYV----------AYSKAATVTGKLVHANFGTKKDFEDLYTPVN----GSIVIVRAGKI
:: :.: . : ::..:.. .:: : .. :.:::.: :::
CCDS82 DGYENVTNIVPPYNAFSAQGMPEGDLVYVNYARTEDFFKLEREMGINCTGKIVIARYGKI
140 150 160 170 180 190
270 280 290 300
pF1KB4 TFAEKVANAESLNAIGVLIYMDQTKF--PIVNAE---LSFFGHAHL--------GTGDPY
..:: :: .:::...: : . . : :. .. : : :.:::
CCDS82 FRGNKVKNAMLAGAIGIILYSDPADYFAPEVQPYPKGWNLPGTAAQRGNVLNLNGAGDPL
200 210 220 230 240 250
310 320 330 340 350 360
pF1KB4 TPGFPSFNHT-QFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDCPSD--WKTDSTCRM-
:::.:. ..: .. .. :.: :::. :. :: :. . : : : :: . .
CCDS82 TPGYPAKEYTFRLDVEEGVGIPRIPVHPIGYNDAEILLRYLGGIAPPDKSWKGALNVSYS
260 270 280 290 300 310
370 380 390 400 410
pF1KB4 -----VTSES-KNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPGAAKS
. :.: ..:.. : :. : .: :. :.:.: ::::.::..:..::.: ::
CCDS82 IGPGFTGSDSFRKVRMHVYNINKITRIYNVVGTIRGSVEPDRYVILGGHRDSWVFGAIDP
320 330 340 350 360 370
420 430 440 450 460 470
pF1KB4 GVGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLHLKAF
:.:.: ..:. :. .. : :..: :.::::::.: .:: .:.::: : .. :. ...
CCDS82 TSGVAVLQEIARSFGKLMSK-GWRPRRTIIFASWDAEEFGLLGSTEWAEENVKILQERSI
380 390 400 410 420 430
480 490 500 510 520 530
pF1KB4 TYINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHPVTG--------QFLYQDSNWASK
.::: :... :. ...:. .:::: :. : ... : : ..: .: . .:
CCDS82 AYINSDSSIEGNYTLRVDCTPLLYQLVYKLTKEIPSPDDGFESKSLYESWLEKDPSPENK
440 450 460 470 480 490
540 550 560 570 580
pF1KB4 ----VEKLTLDNAAFPFLAYSGIPA--VSFCFCEDTD----YPYLGTTMDTYKELIERI-
..:: . .. :: . . . . :: :: : ..:. ::.:..
CCDS82 NLPRINKLGSGSDFEAYFQRLGIASGRARYTKNKKTDKYSSYPVYHTIYETF-ELVEKFY
500 510 520 530 540 550
590 600 610 620 630
pF1KB4 -PELNKVARAAAEVAGQFVIKLTHDVELNLDYERYNSQLLSF---VRDLNQ-YRADIKEM
: ..: ..:.. : .: .:. . . .. . : : .. . .:.. . .. .
CCDS82 DPTFKK-QLSVAQLRGALVYELVDSKIIPFNIQDYAEALKNYAASIYNLSKKHDQQLTDH
560 570 580 590 600 610
640 650 660 670 680 690
pF1KB4 GLSLQWLYSARGDFFRATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYVSPKES
:.:.. :.:: .: .:.: . . ... .. .... .::..: .: :..: : .
CCDS82 GVSFDSLFSAVKNFSEAASDFHKRLIQVDLNNPIAVRMMNDQLMLLERAFIDPLGLPGKL
620 630 640 650 660 670
700 710 720 730 740
pF1KB4 PFRHVFWGSGSH------TLPALLENL-KLRKQNNGAFNETLFRNQLALATWTIQGAANA
.::.... .:: ..:.. . . .... :. . ......:..:::.::..
CCDS82 FYRHIIFAPSSHNKYAGESFPGIYDAIFDIENKANSRLAWKEVKKHISIAAFTIQAAAGT
680 690 700 710 720 730
750 760
pF1KB4 LSGDVWDIDNEF
:
CCDS82 LKEVL
740
>>CCDS73364.1 NAALAD2 gene_id:10003|Hs108|chr11 (707 aa)
initn: 557 init1: 195 opt: 435 Z-score: 507.9 bits: 104.6 E(32554): 5.7e-22
Smith-Waterman score: 747; 26.0% identity (57.5% similar) in 742 aa overlap (72-749:16-703)
50 60 70 80 90 100
pF1KB4 VDEEENADNNTKANVTKPKRCSGSICYGTIAVIVFFLIGFMIGYLGYCKGVEPKTECERL
:... ::.:::.:.. ..: :
CCDS73 MAESRGRLYLWMCLAAALASFLMGFMVGWF-----IKPLKE----
10 20 30
110 120 130 140 150 160
pF1KB4 AGTESPVREEPGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREAGSQK
: . :: : .... :: .. . .. . .. ... .:. ::...
CCDS73 --TTTSVR-------------YHQSIRWKLVSEMKAENIKSFLRSFTK---LPHLAGTEQ
40 50 60 70
170 180 190 200 210
pF1KB4 DENLALYVENQFREFKLSKVWRDQHFVKIQV-KDSAQNSVIIVDKNGRLV----YLVENP
. :: ...:...: :... .. : .. ... : . :::.. . :: :
CCDS73 NFLLAKKIQTQWKKFGLDSAKLVHYDVLLSYPNETNANYISIVDEHETEIFKTSYLEPPP
80 90 100 110 120 130
220 230 240 250 260
pF1KB4 GGYV----------AYSKAATVTGKLVHANFGTKKDFEDLYTPVN----GSIVIVRAGKI
:: :.: . : ::..:.. .:: : .. :.:::.: :::
CCDS73 DGYENVTNIVPPYNAFSAQGMPEGDLVYVNYARTEDFFKLEREMGINCTGKIVIARYGKI
140 150 160 170 180 190
270 280 290 300
pF1KB4 TFAEKVANAESLNAIGVLIYMDQTKF--PIVNAE---LSFFGHAHL--------GTGDPY
..:: :: .:::...: : . . : :. .. : : :.:::
CCDS73 FRGNKVKNAMLAGAIGIILYSDPADYFAPEVQPYPKGWNLPGTAAQRGNVLNLNGAGDPL
200 210 220 230 240 250
310 320 330 340 350 360
pF1KB4 TPGFPSFNHT-QFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDCPSDWKTDSTCRMVTS
:::.:. ..: .. .. :.: :::. :. :: :.
CCDS73 TPGYPAKEYTFRLDVEEGVGIPRIPVHPIGYNDAEILL----------------------
260 270 280 290
370 380 390 400 410 420
pF1KB4 ESKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPGAAKSGVGTALLLK
..:.. : :. : .: :. :.:.: ::::.::..:..::.: :: :.:.: .
CCDS73 --RKVRMHVYNINKITRIYNVVGTIRGSVEPDRYVILGGHRDSWVFGAIDPTSGVAVLQE
300 310 320 330 340 350
430 440 450 460 470 480
pF1KB4 LAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLHLKAFTYINLDKAV
.:. :. .. : :..: :.::::::.: .:: .:.::: : .. :. ....::: :...
CCDS73 IARSFGKLMSK-GWRPRRTIIFASWDAEEFGLLGSTEWAEENVKILQERSIAYINSDSSI
360 370 380 390 400 410
490 500 510 520 530
pF1KB4 LGTSNFKVSASPLLYTLIEKTMQNVKHPVTG--------QFLYQDSNWASK----VEKLT
:. ...:. .:::: :. : ... : : ..: .: . .: ..::
CCDS73 EGNYTLRVDCTPLLYQLVYKLTKEIPSPDDGFESKSLYESWLEKDPSPENKNLPRINKLG
420 430 440 450 460 470
540 550 560 570 580
pF1KB4 LDNAAFPFLAYSGIPA--VSFCFCEDTD----YPYLGTTMDTYKELIERI--PELNKVAR
. .. :: . . . . :: :: : ..:. ::.:.. : ..:
CCDS73 SGSDFEAYFQRLGIASGRARYTKNKKTDKYSSYPVYHTIYETF-ELVEKFYDPTFKK-QL
480 490 500 510 520 530
590 600 610 620 630 640
pF1KB4 AAAEVAGQFVIKLTHDVELNLDYERYNSQLLSF---VRDLNQ-YRADIKEMGLSLQWLYS
..:.. : .: .:. . . .. . : : .. . .:.. . .. . :.:.. :.:
CCDS73 SVAQLRGALVYELVDSKIIPFNIQDYAEALKNYAASIYNLSKKHDQQLTDHGVSFDSLFS
540 550 560 570 580 590
650 660 670 680 690 700
pF1KB4 ARGDFFRATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYVSPKESPFRHVFWGS
: .: .:.: . . ... .. .... .::..: .: :..: : . .::....
CCDS73 AVKNFSEAASDFHKRLIQVDLNNPIAVRMMNDQLMLLERAFIDPLGLPGKLFYRHIIFAP
600 610 620 630 640 650
710 720 730 740 750
pF1KB4 GSH------TLPALLENL-KLRKQNNGAFNETLFRNQLALATWTIQGAANALSGDVWDID
.:: ..:.. . . .... :. . ......:..:::.::..:
CCDS73 SSHNKYAGESFPGIYDAIFDIENKANSRLAWKEVKKHISIAAFTIQAAAGTLKEVL
660 670 680 690 700
760
pF1KB4 NEF
>>CCDS53627.1 FOLH1 gene_id:2346|Hs108|chr11 (704 aa)
initn: 564 init1: 180 opt: 427 Z-score: 498.5 bits: 102.8 E(32554): 1.9e-21
Smith-Waterman score: 705; 26.6% identity (60.3% similar) in 610 aa overlap (128-670:40-645)
100 110 120 130 140 150
pF1KB4 CERLAGTESPVREEPGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREA
:.... :: . :.: . . .:. :
CCDS53 FLAAYACTGCLAERLGWFIKSSNEATNITPKHNMKAFLDELKAENIKKFLYNFTQIPHLA
10 20 30 40 50 60
160 170 180 190 200 210
pF1KB4 GSQKDENLALYVENQFREFKLSKVWRDQHFVKIQVKDSAQ-NSVIIVDKNGRLVY---LV
:.... .:: ...:..:: :..: .. : .. .... : . :....: .. :
CCDS53 GTEQNFQLAKQIQSQWKEFGLDSVELAHYDVLLSYPNKTHPNYISIINEDGNEIFNTSLF
70 80 90 100 110 120
220 230 240 250
pF1KB4 ENPG-GY----------VAYSKAATVTGKLVHANFGTKKDF----EDLYTPVNGSIVIVR
: : :: :.: . : ::..:.. .:: .:. .:.:::.:
CCDS53 EPPPPGYENVSDIVPPFSAFSPQGMPEGDLVYVNYARTEDFFKLERDMKINCSGKIVIAR
130 140 150 160 170 180
260 270 280 290 300
pF1KB4 AGKITFAEKVANAESLNAIGVLIYMDQTKF--PIVNA-----ELSFFG--HAHL----GT
::. ..:: ::. .: ::..: : . . : :.. .: : .... :.
CCDS53 YGKVFRGNKVKNAQLAGAKGVILYSDPADYFAPGVKSYPDGWNLPGGGVQRGNILNLNGA
190 200 210 220 230 240
310 320 330 340 350 360
pF1KB4 GDPYTPGFPSFNHT-QFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDCPSD--WKTDST
::: :::.:. ... . ... :::.:::. :. :.::. .: :. : : :. .
CCDS53 GDPLTPGYPANEYAYRRGIAEAVGLPSIPVHPIGYYDAQKLLEKMGGSAPPDSSWRGSLK
250 260 270 280 290 300
370 380 390 400 410
pF1KB4 CRMVTSE-------SKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPG
. .. ...::. . .. . .: :..:...: ::::.::..:..::.: :
CCDS53 VPYNVGPGFTGNFSTQKVKMHIHSTNEVTRIYNVIGTLRGAVEPDRYVILGGHRDSWVFG
310 320 330 340 350 360
420 430 440 450 460 470
pF1KB4 AAKSGVGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLH
. :.:.. .... :. . :.:..: :.:.::::.: .:: .:.::: : :.
CCDS53 GIDPQSGAAVVHEIVRSFGTLK-KEGWRPRRTILFASWDAEEFGLLGSTEWAEENSRLLQ
370 380 390 400 410 420
480 490 500 510 520 530
pF1KB4 LKAFTYINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHP---VTGQFLYQDSNWASK-
.. .::: :... :. ...:. .::.:.:... ...: : :. ::. .:..:
CCDS53 ERGVAYINADSSIEGNYTLRVDCTPLMYSLVHNLTKELKSPDEGFEGKSLYE--SWTKKS
430 440 450 460 470 480
540 550 560 570
pF1KB4 ----------VEKLTLDNAAFPFLAYSGIPAVSFCFCED------TDYPYLGTTMDTYKE
. :: : :. :: . . .. . :: ....:: :
CCDS53 PSPEFSGMPRISKLGSGNDFEVFFQRLGIASGRARYTKNWETNKFSGYPLYHSVYETY-E
490 500 510 520 530 540
580 590 600 610 620 630
pF1KB4 LIERIPE-LNKVARAAAEVAGQFVIKLTHDVELNLDYERYNSQLLSFVRDLN----QYRA
:.:.. . . : ..:.: : .:..:.... : .: . : : ... . ..
CCDS53 LVEKFYDPMFKYHLTVAQVRGGMVFELANSIVLPFDCRDYAVVLRKYADKIYSISMKHPQ
550 560 570 580 590 600
640 650 660 670 680 690
pF1KB4 DIKEMGLSLQWLYSARGDFFRATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYV
..: ...:.. :.:: .: . .:... . . .:. . .
CCDS53 EMKTYSVSFDSLFSAVKNFTEIASKFSERLQDFDKSKHVIYAPSSHNKYAGESFPGIYDA
610 620 630 640 650 660
700 710 720 730 740 750
pF1KB4 SPKESPFRHVFWGSGSHTLPALLENLKLRKQNNGAFNETLFRNQLALATWTIQGAANALS
CCDS53 LFDIESKVDPSKAWGEVKRQIYVAAFTVQAAAETLSEVA
670 680 690 700
>>CCDS31493.1 FOLH1 gene_id:2346|Hs108|chr11 (719 aa)
initn: 607 init1: 180 opt: 427 Z-score: 498.4 bits: 102.9 E(32554): 1.9e-21
Smith-Waterman score: 705; 26.6% identity (60.3% similar) in 610 aa overlap (128-670:55-660)
100 110 120 130 140 150
pF1KB4 CERLAGTESPVREEPGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREA
:.... :: . :.: . . .:. :
CCDS31 ALVLAGGFFLLGFLFGWFIKSSNEATNITPKHNMKAFLDELKAENIKKFLYNFTQIPHLA
30 40 50 60 70 80
160 170 180 190 200 210
pF1KB4 GSQKDENLALYVENQFREFKLSKVWRDQHFVKIQVKDSAQ-NSVIIVDKNGRLVY---LV
:.... .:: ...:..:: :..: .. : .. .... : . :....: .. :
CCDS31 GTEQNFQLAKQIQSQWKEFGLDSVELAHYDVLLSYPNKTHPNYISIINEDGNEIFNTSLF
90 100 110 120 130 140
220 230 240 250
pF1KB4 ENPG-GY----------VAYSKAATVTGKLVHANFGTKKDF----EDLYTPVNGSIVIVR
: : :: :.: . : ::..:.. .:: .:. .:.:::.:
CCDS31 EPPPPGYENVSDIVPPFSAFSPQGMPEGDLVYVNYARTEDFFKLERDMKINCSGKIVIAR
150 160 170 180 190 200
260 270 280 290 300
pF1KB4 AGKITFAEKVANAESLNAIGVLIYMDQTKF--PIVNA-----ELSFFG--HAHL----GT
::. ..:: ::. .: ::..: : . . : :.. .: : .... :.
CCDS31 YGKVFRGNKVKNAQLAGAKGVILYSDPADYFAPGVKSYPDGWNLPGGGVQRGNILNLNGA
210 220 230 240 250 260
310 320 330 340 350 360
pF1KB4 GDPYTPGFPSFNHT-QFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDCPSD--WKTDST
::: :::.:. ... . ... :::.:::. :. :.::. .: :. : : :. .
CCDS31 GDPLTPGYPANEYAYRRGIAEAVGLPSIPVHPIGYYDAQKLLEKMGGSAPPDSSWRGSLK
270 280 290 300 310 320
370 380 390 400 410
pF1KB4 CRMVTSE-------SKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPG
. .. ...::. . .. . .: :..:...: ::::.::..:..::.: :
CCDS31 VPYNVGPGFTGNFSTQKVKMHIHSTNEVTRIYNVIGTLRGAVEPDRYVILGGHRDSWVFG
330 340 350 360 370 380
420 430 440 450 460 470
pF1KB4 AAKSGVGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLH
. :.:.. .... :. . :.:..: :.:.::::.: .:: .:.::: : :.
CCDS31 GIDPQSGAAVVHEIVRSFGTLK-KEGWRPRRTILFASWDAEEFGLLGSTEWAEENSRLLQ
390 400 410 420 430 440
480 490 500 510 520 530
pF1KB4 LKAFTYINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHP---VTGQFLYQDSNWASK-
.. .::: :... :. ...:. .::.:.:... ...: : :. ::. .:..:
CCDS31 ERGVAYINADSSIEGNYTLRVDCTPLMYSLVHNLTKELKSPDEGFEGKSLYE--SWTKKS
450 460 470 480 490 500
540 550 560 570
pF1KB4 ----------VEKLTLDNAAFPFLAYSGIPAVSFCFCED------TDYPYLGTTMDTYKE
. :: : :. :: . . .. . :: ....:: :
CCDS31 PSPEFSGMPRISKLGSGNDFEVFFQRLGIASGRARYTKNWETNKFSGYPLYHSVYETY-E
510 520 530 540 550 560
580 590 600 610 620 630
pF1KB4 LIERIPE-LNKVARAAAEVAGQFVIKLTHDVELNLDYERYNSQLLSFVRDLN----QYRA
:.:.. . . : ..:.: : .:..:.... : .: . : : ... . ..
CCDS31 LVEKFYDPMFKYHLTVAQVRGGMVFELANSIVLPFDCRDYAVVLRKYADKIYSISMKHPQ
570 580 590 600 610 620
640 650 660 670 680 690
pF1KB4 DIKEMGLSLQWLYSARGDFFRATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYV
..: ...:.. :.:: .: . .:... . . .:. . .
CCDS31 EMKTYSVSFDSLFSAVKNFTEIASKFSERLQDFDKSKHVIYAPSSHNKYAGESFPGIYDA
630 640 650 660 670 680
700 710 720 730 740 750
pF1KB4 SPKESPFRHVFWGSGSHTLPALLENLKLRKQNNGAFNETLFRNQLALATWTIQGAANALS
CCDS31 LFDIESKVDPSKAWGEVKRQIYVAAFTVQAAAETLSEVA
690 700 710
>>CCDS53628.1 FOLH1 gene_id:2346|Hs108|chr11 (735 aa)
initn: 654 init1: 180 opt: 427 Z-score: 498.2 bits: 102.9 E(32554): 2e-21
Smith-Waterman score: 825; 26.8% identity (61.4% similar) in 699 aa overlap (128-750:40-732)
100 110 120 130 140 150
pF1KB4 CERLAGTESPVREEPGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREA
:.... :: . :.: . . .:. :
CCDS53 FLAAYACTGCLAERLGWFIKSSNEATNITPKHNMKAFLDELKAENIKKFLYNFTQIPHLA
10 20 30 40 50 60
160 170 180 190 200 210
pF1KB4 GSQKDENLALYVENQFREFKLSKVWRDQHFVKIQVKDSAQ-NSVIIVDKNGRLVY---LV
:.... .:: ...:..:: :..: .. : .. .... : . :....: .. :
CCDS53 GTEQNFQLAKQIQSQWKEFGLDSVELAHYDVLLSYPNKTHPNYISIINEDGNEIFNTSLF
70 80 90 100 110 120
220 230 240 250
pF1KB4 ENPG-GY----------VAYSKAATVTGKLVHANFGTKKDF----EDLYTPVNGSIVIVR
: : :: :.: . : ::..:.. .:: .:. .:.:::.:
CCDS53 EPPPPGYENVSDIVPPFSAFSPQGMPEGDLVYVNYARTEDFFKLERDMKINCSGKIVIAR
130 140 150 160 170 180
260 270 280 290 300
pF1KB4 AGKITFAEKVANAESLNAIGVLIYMDQTKF--PIVNA-----ELSFFG--HAHL----GT
::. ..:: ::. .: ::..: : . . : :.. .: : .... :.
CCDS53 YGKVFRGNKVKNAQLAGAKGVILYSDPADYFAPGVKSYPDGWNLPGGGVQRGNILNLNGA
190 200 210 220 230 240
310 320 330 340 350 360
pF1KB4 GDPYTPGFPSFNHT-QFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDCPSD--WKTDST
::: :::.:. ... . ... :::.:::. :. :.::. .: :. : : :. .
CCDS53 GDPLTPGYPANEYAYRRGIAEAVGLPSIPVHPIGYYDAQKLLEKMGGSAPPDSSWRGSLK
250 260 270 280 290 300
370 380 390 400 410
pF1KB4 CRMVTSE-------SKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPG
. .. ...::. . .. . .: :..:...: ::::.::..:..::.: :
CCDS53 VPYNVGPGFTGNFSTQKVKMHIHSTNEVTRIYNVIGTLRGAVEPDRYVILGGHRDSWVFG
310 320 330 340 350 360
420 430 440 450 460 470
pF1KB4 AAKSGVGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLH
. :.:.. .... :. . :.:..: :.:.::::.: .:: .:.::: : :.
CCDS53 GIDPQSGAAVVHEIVRSFGTLK-KEGWRPRRTILFASWDAEEFGLLGSTEWAEENSRLLQ
370 380 390 400 410 420
480 490 500 510 520 530
pF1KB4 LKAFTYINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHP---VTGQFLYQDSNWASK-
.. .::: :... :. ...:. .::.:.:... ...: : :. ::. .:..:
CCDS53 ERGVAYINADSSIEGNYTLRVDCTPLMYSLVHNLTKELKSPDEGFEGKSLYE--SWTKKS
430 440 450 460 470 480
540 550 560 570
pF1KB4 ----------VEKLTLDNAAFPFLAYSGIPAVSFCFCED------TDYPYLGTTMDTYKE
. :: : :. :: . . .. . :: ....:: :
CCDS53 PSPEFSGMPRISKLGSGNDFEVFFQRLGIASGRARYTKNWETNKFSGYPLYHSVYETY-E
490 500 510 520 530 540
580 590 600 610 620 630
pF1KB4 LIERIPE-LNKVARAAAEVAGQFVIKLTHDVELNLDYERYNSQLLSFVRDLN----QYRA
:.:.. . . : ..:.: : .:..:.... : .: . : : ... . ..
CCDS53 LVEKFYDPMFKYHLTVAQVRGGMVFELANSIVLPFDCRDYAVVLRKYADKIYSISMKHPQ
550 560 570 580 590 600
640 650 660 670 680 690
pF1KB4 DIKEMGLSLQWLYSARGDFFRATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYV
..: ...:.. :.:: .: . .:... . . .:.. .:.. .::..: .: :..:
CCDS53 EMKTYSVSFDSLFSAVKNFTEIASKFSERLQDFDKSNPIVLRMMNDQLMFLERAFIDPLG
610 620 630 640 650 660
700 710 720 730 740
pF1KB4 SPKESPFRHVFWGSGSH------TLPAL---LENLKLRKQNNGAFNETLFRNQLALATWT
: . .:::... .:: ..:.. : ... . . . :..:. . :. .:..:
CCDS53 LPDRPFYRHVIYAPSSHNKYAGESFPGIYDALFDIESKVDPSKAWGEV--KRQIYVAAFT
670 680 690 700 710 720
750 760
pF1KB4 IQGAANALSGDVWDIDNEF
.:.::..::
CCDS53 VQAAAETLSEVA
730
>>CCDS7946.1 FOLH1 gene_id:2346|Hs108|chr11 (750 aa)
initn: 697 init1: 180 opt: 427 Z-score: 498.1 bits: 102.9 E(32554): 2e-21
Smith-Waterman score: 825; 26.8% identity (61.4% similar) in 699 aa overlap (128-750:55-747)
100 110 120 130 140 150
pF1KB4 CERLAGTESPVREEPGEDFPAARRLYWDDLKRKLSEKLDSTDFTGTIKLLNENSYVPREA
:.... :: . :.: . . .:. :
CCDS79 ALVLAGGFFLLGFLFGWFIKSSNEATNITPKHNMKAFLDELKAENIKKFLYNFTQIPHLA
30 40 50 60 70 80
160 170 180 190 200 210
pF1KB4 GSQKDENLALYVENQFREFKLSKVWRDQHFVKIQVKDSAQ-NSVIIVDKNGRLVY---LV
:.... .:: ...:..:: :..: .. : .. .... : . :....: .. :
CCDS79 GTEQNFQLAKQIQSQWKEFGLDSVELAHYDVLLSYPNKTHPNYISIINEDGNEIFNTSLF
90 100 110 120 130 140
220 230 240 250
pF1KB4 ENPG-GY----------VAYSKAATVTGKLVHANFGTKKDF----EDLYTPVNGSIVIVR
: : :: :.: . : ::..:.. .:: .:. .:.:::.:
CCDS79 EPPPPGYENVSDIVPPFSAFSPQGMPEGDLVYVNYARTEDFFKLERDMKINCSGKIVIAR
150 160 170 180 190 200
260 270 280 290 300
pF1KB4 AGKITFAEKVANAESLNAIGVLIYMDQTKF--PIVNA-----ELSFFG--HAHL----GT
::. ..:: ::. .: ::..: : . . : :.. .: : .... :.
CCDS79 YGKVFRGNKVKNAQLAGAKGVILYSDPADYFAPGVKSYPDGWNLPGGGVQRGNILNLNGA
210 220 230 240 250 260
310 320 330 340 350 360
pF1KB4 GDPYTPGFPSFNHT-QFPPSRSSGLPNIPVQTISRAAAEKLFGNMEGDCPSD--WKTDST
::: :::.:. ... . ... :::.:::. :. :.::. .: :. : : :. .
CCDS79 GDPLTPGYPANEYAYRRGIAEAVGLPSIPVHPIGYYDAQKLLEKMGGSAPPDSSWRGSLK
270 280 290 300 310 320
370 380 390 400 410
pF1KB4 CRMVTSE-------SKNVKLTVSNVLKEIKILNIFGVIKGFVEPDHYVVVGAQRDAWGPG
. .. ...::. . .. . .: :..:...: ::::.::..:..::.: :
CCDS79 VPYNVGPGFTGNFSTQKVKMHIHSTNEVTRIYNVIGTLRGAVEPDRYVILGGHRDSWVFG
330 340 350 360 370 380
420 430 440 450 460 470
pF1KB4 AAKSGVGTALLLKLAQMFSDMVLKDGFQPSRSIIFASWSAGDFGSVGATEWLEGYLSSLH
. :.:.. .... :. . :.:..: :.:.::::.: .:: .:.::: : :.
CCDS79 GIDPQSGAAVVHEIVRSFGTLK-KEGWRPRRTILFASWDAEEFGLLGSTEWAEENSRLLQ
390 400 410 420 430 440
480 490 500 510 520 530
pF1KB4 LKAFTYINLDKAVLGTSNFKVSASPLLYTLIEKTMQNVKHP---VTGQFLYQDSNWASK-
.. .::: :... :. ...:. .::.:.:... ...: : :. ::. .:..:
CCDS79 ERGVAYINADSSIEGNYTLRVDCTPLMYSLVHNLTKELKSPDEGFEGKSLYE--SWTKKS
450 460 470 480 490 500
540 550 560 570
pF1KB4 ----------VEKLTLDNAAFPFLAYSGIPAVSFCFCED------TDYPYLGTTMDTYKE
. :: : :. :: . . .. . :: ....:: :
CCDS79 PSPEFSGMPRISKLGSGNDFEVFFQRLGIASGRARYTKNWETNKFSGYPLYHSVYETY-E
510 520 530 540 550 560
580 590 600 610 620 630
pF1KB4 LIERIPE-LNKVARAAAEVAGQFVIKLTHDVELNLDYERYNSQLLSFVRDLN----QYRA
:.:.. . . : ..:.: : .:..:.... : .: . : : ... . ..
CCDS79 LVEKFYDPMFKYHLTVAQVRGGMVFELANSIVLPFDCRDYAVVLRKYADKIYSISMKHPQ
570 580 590 600 610 620
640 650 660 670 680 690
pF1KB4 DIKEMGLSLQWLYSARGDFFRATSRLTTDFGNAEKTDRFVMKKLNDRVMRVEYHFLSPYV
..: ...:.. :.:: .: . .:... . . .:.. .:.. .::..: .: :..:
CCDS79 EMKTYSVSFDSLFSAVKNFTEIASKFSERLQDFDKSNPIVLRMMNDQLMFLERAFIDPLG
630 640 650 660 670 680
700 710 720 730 740
pF1KB4 SPKESPFRHVFWGSGSH------TLPAL---LENLKLRKQNNGAFNETLFRNQLALATWT
: . .:::... .:: ..:.. : ... . . . :..:. . :. .:..:
CCDS79 LPDRPFYRHVIYAPSSHNKYAGESFPGIYDALFDIESKVDPSKAWGEV--KRQIYVAAFT
690 700 710 720 730
750 760
pF1KB4 IQGAANALSGDVWDIDNEF
.:.::..::
CCDS79 VQAAAETLSEVA
740 750
760 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 21:24:02 2016 done: Thu Nov 3 21:24:02 2016
Total Scan time: 3.140 Total Display time: 0.210
Function used was FASTA [36.3.4 Apr, 2011]