FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5787, 751 aa 1>>>pF1KE5787 751 - 751 aa - 751 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4925+/-0.00118; mu= 18.9291+/- 0.070 mean_var=68.8782+/-13.884, 0's: 0 Z-trim(101.0): 34 B-trim: 0 in 0/49 Lambda= 0.154537 statistics sampled from 6311 (6333) to 6311 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.542), E-opt: 0.2 (0.195), width: 16 Scan time: 2.760 The best scores are: opt bits E(32554) CCDS33885.1 GFM1 gene_id:85476|Hs108|chr3 ( 751) 4962 1116.3 0 CCDS82867.1 GFM1 gene_id:85476|Hs108|chr3 ( 591) 3874 873.6 0 CCDS77851.1 GFM1 gene_id:85476|Hs108|chr3 ( 770) 3439 776.7 0 CCDS47232.1 GFM2 gene_id:84340|Hs108|chr5 ( 513) 721 170.6 5.4e-42 CCDS4023.1 GFM2 gene_id:84340|Hs108|chr5 ( 779) 721 170.7 7.7e-42 CCDS4024.1 GFM2 gene_id:84340|Hs108|chr5 ( 732) 650 154.9 4.2e-37 CCDS3468.1 GUF1 gene_id:60558|Hs108|chr4 ( 669) 348 87.5 7.3e-17 CCDS42071.1 EFL1 gene_id:79631|Hs108|chr15 (1120) 304 77.8 1e-13 >>CCDS33885.1 GFM1 gene_id:85476|Hs108|chr3 (751 aa) initn: 4962 init1: 4962 opt: 4962 Z-score: 5975.0 bits: 1116.3 E(32554): 0 Smith-Waterman score: 4962; 100.0% identity (100.0% similar) in 751 aa overlap (1-751:1-751) 10 20 30 40 50 60 pF1KE5 MRLLGAAAVAALGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MRLLGAAAVAALGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 TLTERVLYYTGRIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TLTERVLYYTGRIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIID 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 TPGHVDFTIEVERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TPGHVDFTIEVERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 SNPARALQQMRSKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYFDGDFGQIVRYGEIPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SNPARALQQMRSKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYFDGDFGQIVRYGEIPA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 ELRAAATDHRQELIECVANSDEQLGEMFLEEKIPSISDLKLAIRRATLKRSFTPVFLGSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ELRAAATDHRQELIECVANSDEQLGEMFLEEKIPSISDLKLAIRRATLKRSFTPVFLGSA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 LKNKGVQPLLDAVLEYLPNPSEVQNYAILNKEDDSKEKTKILMNSSRDNSHPFVGLAFKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LKNKGVQPLLDAVLEYLPNPSEVQNYAILNKEDDSKEKTKILMNSSRDNSHPFVGLAFKL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 EVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARMHADMMEDVEEVYAGDICAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARMHADMMEDVEEVYAGDICAL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 FGIDCASGDTFTDKANSGLSMESIHVPDPVISIAMKPSNKNDLEKFSKGIGRFTREDPTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FGIDCASGDTFTDKANSGLSMESIHVPDPVISIAMKPSNKNDLEKFSKGIGRFTREDPTF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 KVYFDTENKETVISGMGELHLEIYAQRLEREYGCPCITGKPKVAFRETITAPVPFDFTHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KVYFDTENKETVISGMGELHLEIYAQRLEREYGCPCITGKPKVAFRETITAPVPFDFTHK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 KQSGGAGQYGKVIGVLEPLDPEDYTKLEFSDETFGSNIPKQFVPAVEKGFLDACEKGPLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KQSGGAGQYGKVIGVLEPLDPEDYTKLEFSDETFGSNIPKQFVPAVEKGFLDACEKGPLS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 GHKLSGLRFVLQDGAHHMVDSNEISFIRAGEGALKQALANATLCILEPIMAVEVVAPNEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GHKLSGLRFVLQDGAHHMVDSNEISFIRAGEGALKQALANATLCILEPIMAVEVVAPNEF 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE5 QGQVIAGINRRHGVITGQDGVEDYFTLYADVPLNDMFGYSTELRSCTEGKGEYTMEYSRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QGQVIAGINRRHGVITGQDGVEDYFTLYADVPLNDMFGYSTELRSCTEGKGEYTMEYSRY 670 680 690 700 710 720 730 740 750 pF1KE5 QPCLPSTQEDVINKYLEATGQLPVKKGKAKN ::::::::::::::::::::::::::::::: CCDS33 QPCLPSTQEDVINKYLEATGQLPVKKGKAKN 730 740 750 >>CCDS82867.1 GFM1 gene_id:85476|Hs108|chr3 (591 aa) initn: 3874 init1: 3874 opt: 3874 Z-score: 4665.6 bits: 873.6 E(32554): 0 Smith-Waterman score: 3874; 100.0% identity (100.0% similar) in 588 aa overlap (1-588:1-588) 10 20 30 40 50 60 pF1KE5 MRLLGAAAVAALGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MRLLGAAAVAALGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 TLTERVLYYTGRIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 TLTERVLYYTGRIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIID 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 TPGHVDFTIEVERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 TPGHVDFTIEVERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 SNPARALQQMRSKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYFDGDFGQIVRYGEIPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 SNPARALQQMRSKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYFDGDFGQIVRYGEIPA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 ELRAAATDHRQELIECVANSDEQLGEMFLEEKIPSISDLKLAIRRATLKRSFTPVFLGSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 ELRAAATDHRQELIECVANSDEQLGEMFLEEKIPSISDLKLAIRRATLKRSFTPVFLGSA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 LKNKGVQPLLDAVLEYLPNPSEVQNYAILNKEDDSKEKTKILMNSSRDNSHPFVGLAFKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 LKNKGVQPLLDAVLEYLPNPSEVQNYAILNKEDDSKEKTKILMNSSRDNSHPFVGLAFKL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 EVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARMHADMMEDVEEVYAGDICAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 EVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARMHADMMEDVEEVYAGDICAL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 FGIDCASGDTFTDKANSGLSMESIHVPDPVISIAMKPSNKNDLEKFSKGIGRFTREDPTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 FGIDCASGDTFTDKANSGLSMESIHVPDPVISIAMKPSNKNDLEKFSKGIGRFTREDPTF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 KVYFDTENKETVISGMGELHLEIYAQRLEREYGCPCITGKPKVAFRETITAPVPFDFTHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 KVYFDTENKETVISGMGELHLEIYAQRLEREYGCPCITGKPKVAFRETITAPVPFDFTHK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 KQSGGAGQYGKVIGVLEPLDPEDYTKLEFSDETFGSNIPKQFVPAVEKGFLDACEKGPLS :::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 KQSGGAGQYGKVIGVLEPLDPEDYTKLEFSDETFGSNIPKQFVPAVEKVNF 550 560 570 580 590 610 620 630 640 650 660 pF1KE5 GHKLSGLRFVLQDGAHHMVDSNEISFIRAGEGALKQALANATLCILEPIMAVEVVAPNEF >>CCDS77851.1 GFM1 gene_id:85476|Hs108|chr3 (770 aa) initn: 4957 init1: 3439 opt: 3439 Z-score: 4139.7 bits: 776.7 E(32554): 0 Smith-Waterman score: 4914; 97.5% identity (97.5% similar) in 770 aa overlap (1-751:1-770) 10 20 30 40 50 60 pF1KE5 MRLLGAAAVAALGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 MRLLGAAAVAALGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 TLTERVLYYTGRIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 TLTERVLYYTGRIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIID 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 TPGHVDFTIEVERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 TPGHVDFTIEVERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMG 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 SNPARALQQMRSKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYFDGDFG---------- :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SNPARALQQMRSKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYFDGDFGHFLRDFLPLL 190 200 210 220 230 240 240 250 260 270 280 pF1KE5 ---------QIVRYGEIPAELRAAATDHRQELIECVANSDEQLGEMFLEEKIPSISDLKL ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 WNWDRRSGSQIVRYGEIPAELRAAATDHRQELIECVANSDEQLGEMFLEEKIPSISDLKL 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE5 AIRRATLKRSFTPVFLGSALKNKGVQPLLDAVLEYLPNPSEVQNYAILNKEDDSKEKTKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 AIRRATLKRSFTPVFLGSALKNKGVQPLLDAVLEYLPNPSEVQNYAILNKEDDSKEKTKI 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE5 LMNSSRDNSHPFVGLAFKLEVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LMNSSRDNSHPFVGLAFKLEVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARM 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE5 HADMMEDVEEVYAGDICALFGIDCASGDTFTDKANSGLSMESIHVPDPVISIAMKPSNKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 HADMMEDVEEVYAGDICALFGIDCASGDTFTDKANSGLSMESIHVPDPVISIAMKPSNKN 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE5 DLEKFSKGIGRFTREDPTFKVYFDTENKETVISGMGELHLEIYAQRLEREYGCPCITGKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DLEKFSKGIGRFTREDPTFKVYFDTENKETVISGMGELHLEIYAQRLEREYGCPCITGKP 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE5 KVAFRETITAPVPFDFTHKKQSGGAGQYGKVIGVLEPLDPEDYTKLEFSDETFGSNIPKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 KVAFRETITAPVPFDFTHKKQSGGAGQYGKVIGVLEPLDPEDYTKLEFSDETFGSNIPKQ 550 560 570 580 590 600 590 600 610 620 630 640 pF1KE5 FVPAVEKGFLDACEKGPLSGHKLSGLRFVLQDGAHHMVDSNEISFIRAGEGALKQALANA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 FVPAVEKGFLDACEKGPLSGHKLSGLRFVLQDGAHHMVDSNEISFIRAGEGALKQALANA 610 620 630 640 650 660 650 660 670 680 690 700 pF1KE5 TLCILEPIMAVEVVAPNEFQGQVIAGINRRHGVITGQDGVEDYFTLYADVPLNDMFGYST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 TLCILEPIMAVEVVAPNEFQGQVIAGINRRHGVITGQDGVEDYFTLYADVPLNDMFGYST 670 680 690 700 710 720 710 720 730 740 750 pF1KE5 ELRSCTEGKGEYTMEYSRYQPCLPSTQEDVINKYLEATGQLPVKKGKAKN :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ELRSCTEGKGEYTMEYSRYQPCLPSTQEDVINKYLEATGQLPVKKGKAKN 730 740 750 760 770 >>CCDS47232.1 GFM2 gene_id:84340|Hs108|chr5 (513 aa) initn: 822 init1: 444 opt: 721 Z-score: 867.4 bits: 170.6 E(32554): 5.4e-42 Smith-Waterman score: 893; 41.1% identity (64.3% similar) in 414 aa overlap (42-440:66-456) 20 30 40 50 60 70 pF1KE5 LGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKTTLTERVLYYTG : ::::::: ::::.:::: :::.:::.: CCDS47 KPHVPLGRNCSSLPGLIGNDIKSLHSIINPPIAKIRNIGIMAHIDAGKTTTTERILYYSG 40 50 60 70 80 90 80 90 100 110 120 130 pF1KE5 RIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIIDTPGHVDFTIEV .. .: : .: : : ::.:::::::::. :: .:.::::::::::.:: CCDS47 YTRSLGDVDDGD---TVTDFMAQERERGITIQSAAVTFDWKGYRVNLIDTPGHVDFTLEV 100 110 120 130 140 150 140 150 160 170 180 190 pF1KE5 ERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMGSNPARALQQMR :: :::::::: :. : .::. ::.:: :: ..:.: . :.::.:. :.. :....: CCDS47 ERCLRVLDGAVAVFDASAGVEAQTLTVWRQADKHNIPRICFLNKMDKTGASFKYAVESIR 160 170 180 190 200 210 200 210 220 230 240 pF1KE5 SKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYF-----DG-DFGQIVRYGEIPAELRAA ::. . ..:.:.: .:::.::.. .. . . :: :: . :: CCDS47 EKLKAKPLLLQLPIGEAKTFKGVVDVVMKEKLLWNCNSNDGKDFERKPLLEMNDPELLKE 220 230 240 250 260 270 250 260 270 280 290 pF1KE5 ATDHRQELIECVANSDEQLGEMFLEE------KIPSISDLKLAIRRATLKRSFTPVFLGS .:. :. ::: ::. :...... ::: .:. :. ::.:.:: .. .::. :: CCDS47 TTEARNALIEQVADLDDEFADLVLEEFSENFDLLPA-EKLQTAIHRVTLAQTAVPVLCGS 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE5 ALKNKGVQPLLDAVLEYLPNPSEVQNYAILN--KEDDSKEKTKILMNSSRDNSHPFVGLA ::::::.::::::: :::.: : .:: .:. :.: :.: ...: CCDS47 ALKNKGIQPLLDAVTMYLPSPEE-RNYEFLQWYKDDLCALAFKVLHDKQR---------- 340 350 360 370 380 360 370 380 390 400 410 pF1KE5 FKLEVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARMHADMMEDVEEVYAGDI : :...: :.: .: .:.: :..:: ::. .. . ::.: CCDS47 --------GPLVFMRIYSGTIKPQLAIHNINGNCTERISRLLLPFADQHVEIPSLTAGNI 390 400 410 420 430 420 430 440 450 460 470 pF1KE5 CALFGID-CASGDTFTDKANSGLSMESIHVPDPVISIAMKPSNKNDLEKFSKGIGRFTRE :. :.:::.... .:.:. CCDS47 ALTVGLKHTATGDTIVSSKSSALAAARRAEREGEKKHRQNNEAERLLLAGVEIPEPVFFC 440 450 460 470 480 490 >>CCDS4023.1 GFM2 gene_id:84340|Hs108|chr5 (779 aa) initn: 1075 init1: 457 opt: 721 Z-score: 864.6 bits: 170.7 E(32554): 7.7e-42 Smith-Waterman score: 1288; 35.8% identity (61.3% similar) in 737 aa overlap (42-734:66-774) 20 30 40 50 60 70 pF1KE5 LGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKTTLTERVLYYTG : ::::::: ::::.:::: :::.:::.: CCDS40 KPHVPLGRNCSSLPGLIGNDIKSLHSIINPPIAKIRNIGIMAHIDAGKTTTTERILYYSG 40 50 60 70 80 90 80 90 100 110 120 130 pF1KE5 RIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIIDTPGHVDFTIEV .. .: :: .: : : ::.:::::::::. :: .:.::::::::::.:: CCDS40 YTRSLGDV--DDG-DTVTDFMAQERERGITIQSAAVTFDWKGYRVNLIDTPGHVDFTLEV 100 110 120 130 140 150 140 150 160 170 180 190 pF1KE5 ERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMGSNPARALQQMR :: :::::::: :. : .::. ::.:: :: ..:.: . :.::.:. :.. :....: CCDS40 ERCLRVLDGAVAVFDASAGVEAQTLTVWRQADKHNIPRICFLNKMDKTGASFKYAVESIR 160 170 180 190 200 210 200 210 220 230 240 pF1KE5 SKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYF-----DG-DFGQIVRYGEIPAELRAA ::. . ..:.:.: .:::.::.. .. . . :: :: . :: CCDS40 EKLKAKPLLLQLPIGEAKTFKGVVDVVMKEKLLWNCNSNDGKDFERKPLLEMNDPELLKE 220 230 240 250 260 270 250 260 270 280 290 pF1KE5 ATDHRQELIECVANSDEQLGEMFLEE------KIPSISDLKLAIRRATLKRSFTPVFLGS .:. :. ::: ::. :...... ::: .:. :. ::.:.:: .. .::. :: CCDS40 TTEARNALIEQVADLDDEFADLVLEEFSENFDLLPA-EKLQTAIHRVTLAQTAVPVLCGS 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE5 ALKNKGVQPLLDAVLEYLPNPSEVQNYAILN--KEDDSKEKTKILMNSSRDNSHPFVGLA ::::::.::::::: :::.: : .:: .:. :.: :.: ...: CCDS40 ALKNKGIQPLLDAVTMYLPSPEE-RNYEFLQWYKDDLCALAFKVLHDKQR---------- 340 350 360 370 380 360 370 380 390 400 410 pF1KE5 FKLEVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARMHADMMEDVEEVYAGDI : :...: :.: .: .:.: :..:: ::. .. . ::.: CCDS40 --------GPLVFMRIYSGTIKPQLAIHNINGNCTERISRLLLPFADQHVEIPSLTAGNI 390 400 410 420 430 420 430 440 450 pF1KE5 CALFGID-CASGDTFTDKANSGLS-----------------------MESIHVPDPVISI :. :.:::.... .:.:. . ....:.::. CCDS40 ALTVGLKHTATGDTIVSSKSSALAAARRAEREGEKKHRQNNEAERLLLAGVEIPEPVFFC 440 450 460 470 480 490 460 470 480 490 500 510 pF1KE5 AMKP---SNKNDLEKFSKGIGRFTREDPTFKVYFDTENKETVISGMGELHLEIYAQRLER ...: :.. :::. : . ::::..:: .: .. .::. ::::::.:: .:..: CCDS40 TIEPPSLSKQPDLEHALKCL---QREDPSLKVRLDPDSGQTVLCGMGELHIEIIHDRIKR 500 510 520 530 540 520 530 540 550 560 pF1KE5 EYGCPCITGKPKVAFRETITAPVPFDFTHKKQSGGAGQYGKVIGVLEPLDPEDYTK-LEF ::: : .::.:::: : : . : . : .:.. . .:: CCDS40 EYGLETYLGPLQVAYRETILNSVRATDTLDRTLGDKRHLVTVEVEARPIETSSVMPVIEF 550 560 570 580 590 600 570 580 590 600 610 620 pF1KE5 S-DETFGSNIPKQFVPAVEKGFLDACEKGPLSGHKLSGLRFVLQDGAHHMVDSNEISFIR :... .. : :.:.:. .:: .::: : .. . ..:.. . : .. ..: CCDS40 EYAESINEGLLKVSQEAIENGIHSACLQGPLLGSPIQDVAITLHSLTIH--PGTSTTMIS 610 620 630 640 650 660 630 640 650 660 670 680 pF1KE5 AGEG-ALKQALANATLCILEPIMAVEVVAPNEFQGQVIAGINRRHGVITGQDGVEDYFTL : . ...:: .: .:::.: .::.. .. . :.: . .:.: : . .: .. CCDS40 ACVSRCVQKALKKADKQVLEPLMNLEVTVARDYLSPVLADLAQRRGNIQEIQTRQDNKVV 670 680 690 700 710 720 690 700 710 720 730 740 pF1KE5 YADVPLNDMFGYSTELRSCTEGKGEYTMEYSRYQPCLPSTQEDVINKYLEATGQLPVKKG . ::: ...:::: ::. : :.. ...: : :: :. :. ..:. CCDS40 IGFVPLAEIMGYSTVLRTLTSGSATFALELSTYQAMNPQDQNTLLNRRSGLT 730 740 750 760 770 750 pF1KE5 KAKN >>CCDS4024.1 GFM2 gene_id:84340|Hs108|chr5 (732 aa) initn: 1068 init1: 457 opt: 650 Z-score: 779.5 bits: 154.9 E(32554): 4.2e-37 Smith-Waterman score: 1197; 34.9% identity (60.9% similar) in 711 aa overlap (42-734:66-727) 20 30 40 50 60 70 pF1KE5 LGRGRAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKTTLTERVLYYTG : ::::::: ::::.:::: :::.:::.: CCDS40 KPHVPLGRNCSSLPGLIGNDIKSLHSIINPPIAKIRNIGIMAHIDAGKTTTTERILYYSG 40 50 60 70 80 90 80 90 100 110 120 130 pF1KE5 RIAKMHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVNINIIDTPGHVDFTIEV .. .: :: .: : : ::.:::::::::. :: .:.::::::::::.:: CCDS40 YTRSLGDV--DDG-DTVTDFMAQERERGITIQSAAVTFDWKGYRVNLIDTPGHVDFTLEV 100 110 120 130 140 150 140 150 160 170 180 190 pF1KE5 ERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRMGSNPARALQQMR :: :::::::: :. : .::. ::.:: :: ..:.: . :.::.:. :.. :....: CCDS40 ERCLRVLDGAVAVFDASAGVEAQTLTVWRQADKHNIPRICFLNKMDKTGASFKYAVESIR 160 170 180 190 200 210 200 210 220 230 240 pF1KE5 SKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYF-----DG-DFGQIVRYGEIPAELRAA ::. . ..:.:.: .:::.::.. .. . . :: :: . :: CCDS40 EKLKAKPLLLQLPIGEAKTFKGVVDVVMKEKLLWNCNSNDGKDFERKPLLEMNDPELLKE 220 230 240 250 260 270 250 260 270 280 290 pF1KE5 ATDHRQELIECVANSDEQLGEMFLEE------KIPSISDLKLAIRRATLKRSFTPVFLGS .:. :. ::: ::. :...... ::: .:. :. ::.:.:: .. .::. :: CCDS40 TTEARNALIEQVADLDDEFADLVLEEFSENFDLLPA-EKLQTAIHRVTLAQTAVPVLCGS 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE5 ALKNKGVQPLLDAVLEYLPNPSEVQNYAILNKEDDSKEKTKILMNSSRDNSHPFVGLAFK ::::::.::::::: :::.: : .:: .:.. ...:. ::. . CCDS40 ALKNKGIQPLLDAVTMYLPSPEE-RNYEFLER------ISRLLL--------PFADQHVE 340 350 360 370 360 370 380 390 400 410 pF1KE5 LEVGRFGQLTYVRSYQGELKKGDTIYNTRTRKKVRLQRLARMHADMMEDVEEVYAGDICA . :... . . . . :::: .... . .: : .. .:. CCDS40 IPSLTAGNIALTVGLK-HTATGDTIVSSKSSALAAARRAEREGEKKHRQNNEAER----- 380 390 400 410 420 430 420 430 440 450 460 470 pF1KE5 LFGIDCASGDTFTDKANSGLSMESIHVPDPVISIAMKP---SNKNDLEKFSKGIGRFTRE : . ....:.::. ...: :.. :::. : . :: CCDS40 -------------------LLLAGVEIPEPVFFCTIEPPSLSKQPDLEHALKCL---QRE 440 450 460 480 490 500 510 520 530 pF1KE5 DPTFKVYFDTENKETVISGMGELHLEIYAQRLEREYGCPCITGKPKVAFRETITAPVPFD ::..:: .: .. .::. ::::::.:: .:..:::: : .::.:::: : CCDS40 DPSLKVRLDPDSGQTVLCGMGELHIEIIHDRIKREYGLETYLGPLQVAYRETILNSVRAT 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE5 FTHKKQSGGAGQYGKVIGVLEPLDPEDYTK-LEFS-DETFGSNIPKQFVPAVEKGFLDAC : . : . : .:.. . .:: :... .. : :.:.:. .:: CCDS40 DTLDRTLGDKRHLVTVEVEARPIETSSVMPVIEFEYAESINEGLLKVSQEAIENGIHSAC 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE5 EKGPLSGHKLSGLRFVLQDGAHHMVDSNEISFIRAGEG-ALKQALANATLCILEPIMAVE .::: : .. . ..:.. . : .. ..: : . ...:: .: .:::.: .: CCDS40 LQGPLLGSPIQDVAITLHSLTIH--PGTSTTMISACVSRCVQKALKKADKQVLEPLMNLE 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE5 VVAPNEFQGQVIAGINRRHGVITGQDGVEDYFTLYADVPLNDMFGYSTELRSCTEGKGEY :.. .. . :.: . .:.: : . .: .. . ::: ...:::: ::. : :.. . CCDS40 VTVARDYLSPVLADLAQRRGNIQEIQTRQDNKVVIGFVPLAEIMGYSTVLRTLTSGSATF 650 660 670 680 690 700 720 730 740 750 pF1KE5 TMEYSRYQPCLPSTQEDVINKYLEATGQLPVKKGKAKN ..: : :: :. :. ..:. CCDS40 ALELSTYQAMNPQDQNTLLNRRSGLT 710 720 730 >>CCDS3468.1 GUF1 gene_id:60558|Hs108|chr4 (669 aa) initn: 365 init1: 145 opt: 348 Z-score: 416.2 bits: 87.5 E(32554): 7.3e-17 Smith-Waterman score: 353; 24.0% identity (50.1% similar) in 597 aa overlap (2-565:18-485) 10 20 30 40 pF1KE5 MRLLGAAAVAALGRGRAPASLGWQRKQVNWKACRWSSSGVI--- : ::: ..: : :: .:: . .: . : ::. . CCDS34 MWTLVGRGWGCARALAPRATGAALLVAPGPRSAP-TLGAAPE--SWATDRLYSSAEFKEK 10 20 30 40 50 50 60 70 80 90 pF1KE5 ------PNEKIRNIGISAHIDSGKTTLTERVLYYTGRIAKMHEVKGKDGVGAVMDSMELE : :.:::..: ::.: ::.::..:.: :: : : .. : :.:....: CCDS34 LDMSRFPVENIRNFSIVAHVDHGKSTLADRLLELTGTIDKTKNNK------QVLDKLQVE 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE5 RQRGITI--QSAATY--TMWKDVNINIIDTPGHVDFTIEVERALRVLDGAVLVLCAVGGV :.::::. :.:. . :. .:.:::::::::. :: :.: . .:..::. : :. CCDS34 RERGITVKAQTASLFYNCEGKQYLLNLIDTPGHVDFSYEVSRSLSACQGVLLVVDANEGI 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE5 QCQTMTVNRQMKRYNVPFLTFINKLDRMGSNPARALQQMRSKLNHNAAFMQIPMGLEGNF : ::.. . .. . :::.: ...: :. .:... CCDS34 QAQTVANFFLAFEAQLSVIPVINKIDLKNADPERVENQIEK------------------- 180 190 200 210 220 230 240 250 260 270 pF1KE5 KGIVDLIEERAIYFDGDFGQIVRYGEIPAELRAAATDHRQELIECVANSDEQLGEMFLEE :: ::.. ::. CCDS34 ------------VFD-----------IPSD-------------ECI-------------- 220 280 290 300 310 320 330 pF1KE5 KIPSISDLKLAIRRATLKRSFTPVFLGSALKNKGVQPLLDAVLEYLPNPSEVQNYAILNK :.. . ::. .:. .:.:..: .: : CCDS34 --------KISAK------------LGT-----NVESVLQAIIERIPPP----------- 230 240 340 350 360 370 380 390 pF1KE5 EDDSKEKTKILMNSSRDNSHPFVGLAFKLEVGRF-GQLTYVRSYQGELKKGDTIYNTRTR :. : : :. .:.: .. : .. : ..: ..::: : ...:. CCDS34 --------KV----HRKN--PLRALVFDSTFDQYRGVIANVALFDGVVSKGDKIVSAHTQ 250 260 270 280 290 400 410 420 430 440 pF1KE5 KKVRLQRLARMHADMMEDVEEVYAGDICALF-GIDCAS----GDTFTDKANSGLSMESIH : ...... .. . . ....:::.. :. :. .. :::. . . . ... CCDS34 KTYEVNEVGVLNPNE-QPTHKLYAGQVGYLIAGMKDVTEAQIGDTLCLHKQPVEPLPGFK 300 310 320 330 340 350 450 460 470 480 490 500 pF1KE5 VPDPVISIAMKPSNKNDLEKFSKGIGRFTREDPTFKVYFDTENKETV---ISGMGELHLE :.. .: : .... ......: ..: .: . :. :. . .. .: ::.: CCDS34 SAKPMVFAGMYPLDQSEYNNLKSAIEKLTLNDSSVTVHRDSSLALGAGWRLGFLGLLHME 360 370 380 390 400 410 510 520 530 540 550 pF1KE5 IYAQRLEREYGCPCITGKPKVAFRETITAPVPFDFTHKKQSG--GAGQY---GKVIGVLE .. ::::.::. : : : .. .... . ..:. . .:. .:: :: CCDS34 VFNQRLEQEYNASVILTTPTVPYKAVLSSSKLIKEHREKEITIINPAQFPDKSKVTEYLE 420 430 440 450 460 470 560 570 580 590 600 610 pF1KE5 P------LDPEDYTKLEFSDETFGSNIPKQFVPAVEKGFLDACEKGPLSGHKLSGLRFVL : . :..:: CCDS34 PVVLGTIITPDEYTGKIMMLCEARRAVQKNMIFIDQNRVMLKYLFPLNEIVVDFYDSLKS 480 490 500 510 520 530 >>CCDS42071.1 EFL1 gene_id:79631|Hs108|chr15 (1120 aa) initn: 402 init1: 196 opt: 304 Z-score: 359.8 bits: 77.8 E(32554): 1e-13 Smith-Waterman score: 304; 39.3% identity (63.8% similar) in 163 aa overlap (46-200:19-176) 20 30 40 50 60 70 pF1KE5 RAPASLGWQRKQVNWKACRWSSSGVIPNEKIRNIGISAHIDSGKTTLTERVLYYTGRIAK :::: . ::.: :::::.. .. .: :.. CCDS42 MVLNSLDKMIQLQKNTANIRNICVLAHVDHGKTTLADCLISSNGIISS 10 20 30 40 80 90 100 110 120 130 pF1KE5 MHEVKGKDGVGAVMDSMELERQRGITIQSAATYTMWKDVN----INIIDTPGHVDFTIEV .. :: ::: : :. ::::..:.: . : ::.::.::::::. :: CCDS42 --RLAGKL---RYMDSREDEQIRGITMKSSAISLHYATGNEEYLINLIDSPGHVDFSSEV 50 60 70 80 90 100 140 150 160 170 180 pF1KE5 ERALRVLDGAVLVLCAVGGVQCQTMTVNRQMKRYNVPFLTFINKLDRM----GSNPARAL :.:. :: ..:. :: :: ::..: :: :. . :::.::. .: .: CCDS42 STAVRICDGCIIVVDAVEGVCPQTQAVLRQAWLENIRPVLVINKIDRLIVELKFTPQEAY 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE5 QQMRSKLNHNAAFMQIPMGLEGNFKGIVDLIEERAIYFDGDFGQIVRYGEIPAELRAAAT ..... :.. :. CCDS42 SHLKNILEQINALTGTLFTSKVLEERAERETESQVNPNSEQGEQVYDWSTGLEDTDDSHL 170 180 190 200 210 220 751 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 06:38:59 2016 done: Tue Nov 8 06:38:59 2016 Total Scan time: 2.760 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]