FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4476, 495 aa 1>>>pF1KE4476 495 - 495 aa - 495 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4276+/-0.000884; mu= 16.8365+/- 0.053 mean_var=63.8467+/-13.639, 0's: 0 Z-trim(105.1): 32 B-trim: 0 in 0/48 Lambda= 0.160511 statistics sampled from 8194 (8222) to 8194 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.61), E-opt: 0.2 (0.253), width: 16 Scan time: 2.650 The best scores are: opt bits E(32554) CCDS4981.1 SLC17A5 gene_id:26503|Hs108|chr6 ( 495) 3342 782.9 0 CCDS69060.1 SLC17A2 gene_id:10246|Hs108|chr6 ( 478) 1192 285.0 1.2e-76 CCDS7856.1 SLC17A6 gene_id:57084|Hs108|chr11 ( 582) 1168 279.5 6.7e-75 CCDS9077.1 SLC17A8 gene_id:246213|Hs108|chr12 ( 589) 1158 277.2 3.4e-74 CCDS12764.1 SLC17A7 gene_id:57030|Hs108|chr19 ( 560) 1144 274.0 3.1e-73 CCDS4564.1 SLC17A4 gene_id:10050|Hs108|chr6 ( 497) 1135 271.9 1.2e-72 CCDS75411.1 SLC17A4 gene_id:10050|Hs108|chr6 ( 443) 1090 261.4 1.4e-69 CCDS4565.1 SLC17A1 gene_id:6568|Hs108|chr6 ( 467) 1066 255.9 7.1e-68 CCDS47385.1 SLC17A3 gene_id:10786|Hs108|chr6 ( 498) 1066 255.9 7.5e-68 CCDS4567.1 SLC17A2 gene_id:10246|Hs108|chr6 ( 436) 896 216.5 4.8e-56 CCDS4566.2 SLC17A3 gene_id:10786|Hs108|chr6 ( 420) 768 186.8 3.9e-47 CCDS44957.1 SLC17A8 gene_id:246213|Hs108|chr12 ( 539) 598 147.5 3.4e-35 CCDS77600.1 SLC17A9 gene_id:63910|Hs108|chr20 ( 430) 401 101.9 1.5e-21 CCDS42901.1 SLC17A9 gene_id:63910|Hs108|chr20 ( 436) 401 101.9 1.5e-21 >>CCDS4981.1 SLC17A5 gene_id:26503|Hs108|chr6 (495 aa) initn: 3342 init1: 3342 opt: 3342 Z-score: 4180.0 bits: 782.9 E(32554): 0 Smith-Waterman score: 3342; 100.0% identity (100.0% similar) in 495 aa overlap (1-495:1-495) 10 20 30 40 50 60 pF1KE4 MRSPVRDLARNDGEESTDRTPLLPGAPRAEAAPVCCSARYNLAILAFFGFFIVYALRVNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 MRSPVRDLARNDGEESTDRTPLLPGAPRAEAAPVCCSARYNLAILAFFGFFIVYALRVNL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 SVALVDMVDSNTTLEDNRTSKACPEHSAPIKVHHNQTGKKYQWDAETQGWILGSFFYGYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 SVALVDMVDSNTTLEDNRTSKACPEHSAPIKVHHNQTGKKYQWDAETQGWILGSFFYGYI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 ITQIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRALEGLGEGVTFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 ITQIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRALEGLGEGVTFP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 AMHAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVFYFFGTIGIFW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 AMHAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVFYFFGTIGIFW 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 FLLWIWLVSDTPQKHKRISHYEKEYILSSLRNQLSSQKSVPWVPILKSLPLWAIVVAHFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 FLLWIWLVSDTPQKHKRISHYEKEYILSSLRNQLSSQKSVPWVPILKSLPLWAIVVAHFS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 YNWTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAADNLRAKWNFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 YNWTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAADNLRAKWNFST 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 LCVRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSINHLDIAPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 LCVRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSINHLDIAPS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 YAGILLGITNTFATIPGMVGPVIAKSLTPDNTVGEWQTVFYIAAAINVFGAIFFTLFAKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 YAGILLGITNTFATIPGMVGPVIAKSLTPDNTVGEWQTVFYIAAAINVFGAIFFTLFAKG 430 440 450 460 470 480 490 pF1KE4 EVQNWALNDHHGHRH ::::::::::::::: CCDS49 EVQNWALNDHHGHRH 490 >>CCDS69060.1 SLC17A2 gene_id:10246|Hs108|chr6 (478 aa) initn: 671 init1: 556 opt: 1192 Z-score: 1489.5 bits: 285.0 E(32554): 1.2e-76 Smith-Waterman score: 1192; 39.2% identity (71.6% similar) in 472 aa overlap (23-486:1-470) 10 20 30 40 50 60 pF1KE4 MRSPVRDLARNDGEESTDRTPLLPGAPRAEAAPVCCSARYNLAILAFFGFFIVYALRVNL . : : .. .: :: ::.::.. :. : . . ::.: CCDS69 MDGKPATRKGPDFCSLRYGLALIMHFSNFTMITQRVSL 10 20 30 70 80 90 100 110 pF1KE4 SVALVDMVD-------SNTTLEDNRTSKACPEHSAPIKVHHNQTGKKYQWDAETQGWILG :.:.. ::. ::.. : . .. : . : :: . . .. :::. :::: :.. CCDS69 SIAIIAMVNTTQQQGLSNASTE-GPVADAFNNSSISIK-EFDTKASVYQWSPETQGIIFS 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 SFFYGYIITQIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRALEGL :. :: :.: ::.::.:. .:.: .:: :.: ...::::::.:::.:: .:..:...:. CCDS69 SINYGIILTLIPSGYLAGIFGAKKMLGAGLLISSLLTLFTPLAADFGVILVIMVRTVQGM 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 GEGVTFPAMHAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVFYFF ..:... .. ..:..:::::::::: .:. .:. .:. : : ..:.: ..: ..::.: CCDS69 AQGMAWTGQFTIWAKWAPPLERSKLTTIAGSGSAFGSFIILCVGGLISQALSWPFIFYIF 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 GTIGIFWFLLWIWLVSDTPQKHKRISHYEKEYILSSLRNQLSSQ-KSVPWVPILKSLPLW :. : :::. .. : :..: :: :::.::::: .: :: ..:: .. :::: CCDS69 GSTGCVCCLLWFTVIYDDPMHHPCISVREKEHILSSLAQQPSSPGRAVPIKAMVTCLPLW 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 AIVVAHFSYNWTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAADNL :: .. ::. : .:: ::::.. .:. :....: :::::.... : ::.:: :: : CCDS69 AIFLGFFSHFWLCTIILTYLPTYISTLLHVNIRDSGVLSSLPFIAAASCTILGGQLADFL 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 RAKWNFSTLCVRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSI .. . . ::..:: .:.. :.. :: :.. .: ... .: . ...:.::: : CCDS69 LSRNLLRLITVRKLFSSLGLLLPSICAVALPFVASSYVITIILLILIPGTSNLCDSGFII 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE4 NHLDIAPSYAGILLGITNTFATIPGMVGPVIAKSLTPDNTVGEWQTVFYIAAAINVFGAI : ::::: ::..:.::. :. : :... . . : .. . :..::...::.:.:: . CCDS69 NTLDIAPRYASFLMGISRGFGLIAGIISSTATGFLISQDFESGWRNVFFLSAAVNMFGLV 400 410 420 430 440 450 480 490 pF1KE4 FFTLFAKGEVQNWALNDHHGHRH :. :...:.:.:: CCDS69 FYLTFGQAELQDWAKERTLTRL 460 470 >>CCDS7856.1 SLC17A6 gene_id:57084|Hs108|chr11 (582 aa) initn: 1258 init1: 610 opt: 1168 Z-score: 1458.2 bits: 279.5 E(32554): 6.7e-75 Smith-Waterman score: 1259; 41.5% identity (72.3% similar) in 484 aa overlap (14-486:42-506) 10 20 30 pF1KE4 MRSPVRDLARNDGEESTDRTPLLPGAPRAEAAPVC-CSA---- : . : :: .:. .: :.: :. CCDS78 GKEGLKNFAGKSLGQIYRVLEKKQDTGETIELTEDGKPLE--VPERKA-PLCDCTCFGLP 20 30 40 50 60 40 50 60 70 80 90 pF1KE4 -RYNLAILAFFGFFIVYALRVNLSVALVDMVDSNTTLEDNRTSKACPEHSAPIKVHHNQT :: .::.. .:: : ...: ::.::.::::. :.:. .: .:. :.. CCDS78 RRYIIAIMSGLGFCISFGIRCNLGVAIVDMVN-NSTI--HRGGKVIKEKA---------- 70 80 90 100 110 100 110 120 130 140 150 pF1KE4 GKKYQWDAETQGWILGSFFYGYIITQIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAA :..:: :: : : ::::.:::::::::::.::..... ..: .:: :..:... : :: CCDS78 --KFNWDPETVGMIHGSFFWGYIITQIPGGYIASRLAANRVFGAAILLTSTLNMLIPSAA 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE4 DLGVGPLIVLRALEGLGEGVTFPAMHAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLS . : .: .: :.:: ::::.:: :..::.::::::::.: . :. :. :.::..::. CCDS78 RVHYGCVIFVRILQGLVEGVTYPACHGIWSKWAPPLERSRLATTSFCGSYAGAVIAMPLA 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE4 GIICYYMNWTYVFYFFGTIGIFWFLLWIWLVSDTPQKHKRISHYEKEYILSSL---RNQL ::. : .:. ::: .:..:. :...:. . ..: :: :. :..:: :. : : CCDS78 GILVQYTGWSSVFYVYGSFGMVWYMFWLLVSYESPAKHPTITDEERRYIEESIGESANLL 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE4 SSQKS--VPWVPILKSLPLWAIVVAHFSYNWTFYTLLTLLPTYMKEILRFNVQENGFLSS ..... .:: .. :.:..::.::.: .:::: :: :.:..:.. :.... :.::. CCDS78 GAMEKFKTPWRKFFTSMPVYAIIVANFCRSWTFYLLLISQPAYFEEVFGFEISKVGMLSA 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE4 LPYLGSWLCMILSGQAADNLRAKWNFSTLCVRRIFSLIGMIGPAVFLVAAGFIGCDYSLA .:.: . . ..:: :: ::.: .:: ::.:.. :. :..:...:. . ..: CCDS78 VPHLVMTIIVPIGGQIADFLRSKQILSTTTVRKIMNCGGFGMEATLLLVVGY-SHTRGVA 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE4 VAFLTISTTLGGFCSSGFSINHLDIAPSYAGILLGITNTFATIPGMVGPVIAKSLTPDNT ..::.... ..:: :::..::::::: ::.::.::.: .:. ::: :.:. ..: ... CCDS78 ISFLVLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPIIVGAMTKNKS 420 430 440 450 460 470 460 470 480 490 pF1KE4 VGEWQTVFYIAAAINVFGAIFFTLFAKGEVQNWALNDHHGHRH ::: :: ::: .. :.::...::.:: : :: CCDS78 REEWQYVFLIAALVHYGGVIFYAIFASGEKQPWADPEETSEEKCGFIHEDELDEETGDIT 480 490 500 510 520 530 CCDS78 QNYINYGTTKSYGATTQANGGWPSGWEKKEEFVQGEVQDSHSYKDRVDYS 540 550 560 570 580 >>CCDS9077.1 SLC17A8 gene_id:246213|Hs108|chr12 (589 aa) initn: 1013 init1: 598 opt: 1158 Z-score: 1445.6 bits: 277.2 E(32554): 3.4e-74 Smith-Waterman score: 1247; 41.9% identity (73.6% similar) in 458 aa overlap (35-486:69-510) 10 20 30 40 50 60 pF1KE4 VRDLARNDGEESTDRTPLLPGAPRAEAAPVCCS--ARYNLAILAFFGFFIVYALRVNLSV ::. :: .::.. .:: : ...: ::.: CCDS90 TTEEEDNIELNEEGRPVQTSRPSPPLCDCHCCGLPKRYIIAIMSGLGFCISFGIRCNLGV 40 50 60 70 80 90 70 80 90 100 110 120 pF1KE4 ALVDMVDSNTTLEDNRTSKACPEHSAPIKVHHNQTGKKYQWDAETQGWILGSFFYGYIIT :.:.::...:. :.. :: ::.. ..:: :: : : ::::.:::.: CCDS90 AIVEMVNNSTVYVDGK-----PE---------IQTAQ-FNWDPETVGLIHGSFFWGYIMT 100 110 120 130 140 130 140 150 160 170 180 pF1KE4 QIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRALEGLGEGVTFPAM :::::....:.... ..: .:. :..:..: : :: . : .. .: :.:: ::::.:: CCDS90 QIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARVHYGCVMCVRILQGLVEGVTYPAC 150 160 170 180 190 200 190 200 210 220 230 240 pF1KE4 HAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVFYFFGTIGIFWFL :.:::.::::::::.: . :. :. :.:...::.:.. :..:. :::..: .::.:.. CCDS90 HGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGVLVQYIGWSSVFYIYGMFGIIWYM 210 220 230 240 250 260 250 260 270 280 290 pF1KE4 LWIWLVSDTPQKHKRISHYEKEYILSSL---RNQLSSQK-SVPWVPILKSLPLWAIVVAH .:. . . : : ::. :: :: .:. : .: .: :.:: .. :::..::.::. CCDS90 FWLLQAYECPAAHPTISNEEKTYIETSIGEGANVVSLSKFSTPWKRFFTSLPVYAIIVAN 270 280 290 300 310 320 300 310 320 330 340 350 pF1KE4 FSYNWTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAADNLRAKWNF : .:::: :: :.:..:.. : ... :.::..:.. . . ..:: :: ::.. . CCDS90 FCRSWTFYLLLISQPAYFEEVFGFAISKVGLLSAVPHMVMTIVVPIGGQLADYLRSRQIL 330 340 350 360 370 380 360 370 380 390 400 410 pF1KE4 STLCVRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSINHLDIA .: ::.:.. :. :..:...:: . ..:..::.... ..:: :::..:::::: CCDS90 TTTAVRKIMNCGGFGMEATLLLVVGF-SHTKGVAISFLVLAVGFSGFAISGFNVNHLDIA 390 400 410 420 430 440 420 430 440 450 460 470 pF1KE4 PSYAGILLGITNTFATIPGMVGPVIAKSLTPDNTVGEWQTVFYIAAAINVFGAIFFTLFA : ::.::.::.: .:. ::: :.:. ..: .: :::.:: ::: .. :.::. .:: CCDS90 PRYASILMGISNGVGTLSGMVCPLIVGAMTRHKTREEWQNVFLIAALVHYSGVIFYGVFA 450 460 470 480 490 500 480 490 pF1KE4 KGEVQNWALNDHHGHRH .:: :.:: CCDS90 SGEKQEWADPENLSEEKCGIIDQDELAEEIELNHESFASPKKKMSYGATSQNCEVQKKEW 510 520 530 540 550 560 >>CCDS12764.1 SLC17A7 gene_id:57030|Hs108|chr19 (560 aa) initn: 1227 init1: 601 opt: 1144 Z-score: 1428.4 bits: 274.0 E(32554): 3.1e-73 Smith-Waterman score: 1216; 39.2% identity (71.4% similar) in 490 aa overlap (10-486:26-498) 10 20 30 pF1KE4 MRSPVRDLARNDGEE----STDRTPLLPGAPRAEAAPVCCSA-- :..: : :.: :. . .. : . CCDS12 MEFRQEEFRKLAGRALGKLHRLLEKRQEGAETLELSADGRPVTTQTRDPPVVDCTCFGLP 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE4 -RYNLAILAFFGFFIVYALRVNLSVALVDMVDSNTTLEDNRTSKACPEHSAPIKVHHNQT :: .::.. .:: : ...: ::.::.:.::...:: .... . :.. : CCDS12 RRYIIAIMSGLGFCISFGIRCNLGVAIVSMVNNSTT-----------HRGGHVVVQKAQ- 70 80 90 100 100 110 120 130 140 150 pF1KE4 GKKYQWDAETQGWILGSFFYGYIITQIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAA ..:: :: : : ::::.:::.::::::.. .:.... ..::.:..:..:... : :: CCDS12 ---FSWDPETVGLIHGSFFWGYIVTQIPGGFICQKFAANRVFGFAIVATSTLNMLIPSAA 110 120 130 140 150 160 160 170 180 190 200 210 pF1KE4 DLGVGPLIVLRALEGLGEGVTFPAMHAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLS . : .: .: :.:: ::::.:: :..::.::::::::.: . .. :. :.:...::. CCDS12 RVHYGCVIFVRILQGLVEGVTYPACHGIWSKWAPPLERSRLATTAFCGSYAGAVVAMPLA 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE4 GIICYYMNWTYVFYFFGTIGIFWFLLWIWLVSDTPQKHKRISHYEKEYILSS------LR :.. : .:. ::: .:..::::.:.:. . ..: : ::. :..:: .. : CCDS12 GVLVQYSGWSSVFYVYGSFGIFWYLFWLLVSYESPALHPSISEEERKYIEDAIGESAKLM 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE4 NQLSSQKSVPWVPILKSLPLWAIVVAHFSYNWTFYTLLTLLPTYMKEILRFNVQENGFLS : :. . :.:: .. :.:..::.::.: .:::: :: :.:..:.. :.... :..: CCDS12 NPLT-KFSTPWRRFFTSMPVYAIIVANFCRSWTFYLLLISQPAYFEEVFGFEISKVGLVS 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE4 SLPYLGSWLCMILSGQAADNLRAKWNFSTLCVRRIFSLIGMIGPAVFLVAAGFIGCDYSL .::.: . . ..:: :: ::.. .:: ::.... :. :..:...:. . . .. CCDS12 ALPHLVMTIIVPIGGQIADFLRSRRIMSTTNVRKLMNCGGFGMEATLLLVVGY-SHSKGV 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE4 AVAFLTISTTLGGFCSSGFSINHLDIAPSYAGILLGITNTFATIPGMVGPVIAKSLTPDN :..::.... ..:: :::..::::::: ::.::.::.: .:. ::: :.:. ..: . CCDS12 AISFLVLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPIIVGAMTKHK 410 420 430 440 450 460 460 470 480 490 pF1KE4 TVGEWQTVFYIAAAINVFGAIFFTLFAKGEVQNWALNDHHGHRH : ::: :: ::. .. :.::. .::.:: : :: CCDS12 TREEWQYVFLIASLVHYGGVIFYGVFASGEKQPWAEPEEMSEEKCGFVGHDQLAGSDDSE 470 480 490 500 510 520 CCDS12 MEDEAEPPGAPPAPPPSYGATHSTFQPPRPPPPVRDY 530 540 550 560 >>CCDS4564.1 SLC17A4 gene_id:10050|Hs108|chr6 (497 aa) initn: 1103 init1: 565 opt: 1135 Z-score: 1417.9 bits: 271.9 E(32554): 1.2e-72 Smith-Waterman score: 1135; 38.1% identity (71.9% similar) in 467 aa overlap (36-493:33-496) 10 20 30 40 50 60 pF1KE4 RDLARNDGEESTDRTPLLPGAPRAEAAPVCCSARYNLAILAFFGFFIVYALRVNLSVALV ::.:..::.. . : .:. ..:::.:. CCDS45 TGPDVKATVGDISSDGNLNVAQEECSRKGFCSVRHGLALILQLCNFSIYTQQMNLSIAIP 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 DMVDSNTTLEDNRTSKACPEHSAPIKVHHNQTGKK-------YQWDAETQGWILGSFFYG :: :.: .. . . . :. . . :.: :. :.:. : :: ::.:. :: CCDS45 AMV--NNTAPPSQPNASTERPSTDSQGYWNETLKEFKAMAPAYDWSPEIQGIILSSLNYG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 YIITQIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRALEGLGEGVT ... ::.::::. .:.:...: :.. .. :::: :.::. ::. ::::: ..:... .. CCDS45 SFLAPIPSGYVAGIFGAKYVVGAGLFISSFLTLFIPLAANAGVALLIVLRIVQGIAQVMV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 FPAMHAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVFYFFGTIGI . .....: .::::::::.: .:. .:..::. : : .:..: ..: ::::.:: :: CCDS45 LTGQYSIWVKWAPPLERSQLTTIAGSGSMLGSFIVLLAGGLLCQTIGWPYVFYIFGGIGC 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 FWFLLWIWLVSDTPQKHKRISHYEKEYILSSLRNQLSSQK-SVPWVPILKSLPLWAIVVA ::. :. : : .: :: ::.::. :: .: : :.: ..::::::::.:. CCDS45 ACCPLWFPLIYDDPVNHPFISAGEKRYIVCSLAQQDCSPGWSLPIRAMIKSLPLWAILVS 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 HFSYNWTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAADNLRAKWN .: : :::... :::.. .:. :....:.::.::.. . .:.::.: :: : .. CCDS45 YFCEYWLFYTIMAYTPTYISSVLQANLRDSGILSALPFVVGCICIILGGLLADFLLSRKI 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE4 FSTLCVRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSINHLDI . . .:..:. ::.. :.:.::. .. ..:....::..:.....:: :: .: ::: CCDS45 LRLITIRKLFTAIGVLFPSVILVSLPWVRSSHSMTMTFLVLSSAISSFCESGALVNFLDI 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE4 APSYAGILLGITNTFATIPGMVGPVIAKS-LTPDNTVGEWQTVFYIAAAINVFGAIFFTL :: :.:.: :. ..:: : : ..:. : .. :. : :..:: ..::.:. : .:. . CCDS45 APRYTGFLKGLLQVFAHIAGAISPTAAGFFISQDSEFG-WRNVFLLSAAVNISGLVFYLI 430 440 450 460 470 480 490 pF1KE4 FAKGEVQNWALNDHHGHRH :....::.:: .. : CCDS45 FGRADVQDWAKEQTFTHL 480 490 >>CCDS75411.1 SLC17A4 gene_id:10050|Hs108|chr6 (443 aa) initn: 1057 init1: 565 opt: 1090 Z-score: 1362.4 bits: 261.4 E(32554): 1.4e-69 Smith-Waterman score: 1090; 38.4% identity (71.9% similar) in 445 aa overlap (58-493:1-442) 30 40 50 60 70 80 pF1KE4 RAEAAPVCCSARYNLAILAFFGFFIVYALRVNLSVALVDMVDSNTTLEDNRTSKACPEHS .:::.:. :: :.: .. . . . : CCDS75 MNLSIAIPAMV--NNTAPPSQPNASTERPS 10 20 90 100 110 120 130 140 pF1KE4 APIKVHHNQTGKK-------YQWDAETQGWILGSFFYGYIITQIPGGYVASKIGGKMLLG . . . :.: :. :.:. : :: ::.:. :: ... ::.::::. .:.:...: CCDS75 TDSQGYWNETLKEFKAMAPAYDWSPEIQGIILSSLNYGSFLAPIPSGYVAGIFGAKYVVG 30 40 50 60 70 80 150 160 170 180 190 200 pF1KE4 FGILGTAVLTLFTPIAADLGVGPLIVLRALEGLGEGVTFPAMHAMWSSWAPPLERSKLLS :.. .. :::: :.::. ::. ::::: ..:... ... .....: .::::::::.: . CCDS75 AGLFISSFLTLFIPLAANAGVALLIVLRIVQGIAQVMVLTGQYSIWVKWAPPLERSQLTT 90 100 110 120 130 140 210 220 230 240 250 260 pF1KE4 ISYAGAQLGTVISLPLSGIICYYMNWTYVFYFFGTIGIFWFLLWIWLVSDTPQKHKRISH :. .:..::. : : .:..: ..: ::::.:: :: ::. :. : : .: :: CCDS75 IAGSGSMLGSFIVLLAGGLLCQTIGWPYVFYIFGGIGCACCPLWFPLIYDDPVNHPFISA 150 160 170 180 190 200 270 280 290 300 310 pF1KE4 YEKEYILSSLRNQLSSQK-SVPWVPILKSLPLWAIVVAHFSYNWTFYTLLTLLPTYMKEI ::.::. :: .: : :.: ..::::::::.:..: : :::... :::.. . CCDS75 GEKRYIVCSLAQQDCSPGWSLPIRAMIKSLPLWAILVSYFCEYWLFYTIMAYTPTYISSV 210 220 230 240 250 260 320 330 340 350 360 370 pF1KE4 LRFNVQENGFLSSLPYLGSWLCMILSGQAADNLRAKWNFSTLCVRRIFSLIGMIGPAVFL :. :....:.::.::.. . .:.::.: :: : .. . . .:..:. ::.. :.:.: CCDS75 LQANLRDSGILSALPFVVGCICIILGGLLADFLLSRKILRLITIRKLFTAIGVLFPSVIL 270 280 290 300 310 320 380 390 400 410 420 430 pF1KE4 VAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSINHLDIAPSYAGILLGITNTFATIPGMV :. .. ..:....::..:.....:: :: .: ::::: :.:.: :. ..:: : : . CCDS75 VSLPWVRSSHSMTMTFLVLSSAISSFCESGALVNFLDIAPRYTGFLKGLLQVFAHIAGAI 330 340 350 360 370 380 440 450 460 470 480 490 pF1KE4 GPVIAKS-LTPDNTVGEWQTVFYIAAAINVFGAIFFTLFAKGEVQNWALNDHHGHRH .:. : .. :. : :..:: ..::.:. : .:. .:....::.:: .. : CCDS75 SPTAAGFFISQDSEFG-WRNVFLLSAAVNISGLVFYLIFGRADVQDWAKEQTFTHL 390 400 410 420 430 440 >>CCDS4565.1 SLC17A1 gene_id:6568|Hs108|chr6 (467 aa) initn: 1121 init1: 532 opt: 1066 Z-score: 1332.0 bits: 255.9 E(32554): 7.1e-68 Smith-Waterman score: 1066; 38.4% identity (65.9% similar) in 464 aa overlap (33-491:13-464) 10 20 30 40 50 60 pF1KE4 SPVRDLARNDGEESTDRTPLLPGAPRAEAAPVCCSARYNLAILAFFGFFIVYALRVNLSV : :: ::.:..:. :. : :. :.. CCDS45 MQMDNRLPPKKVPGFCSFRYGLSFLVHCCNVIITAQRACLNL 10 20 30 40 70 80 90 100 110 120 pF1KE4 ALVDMVDSNTTLEDNRTSKACPEHSAPIKVHHNQTGKKYQWDAETQGWILGSFFYGYIIT ..: ::.:. .. :. :. :. : . :.:. . :: ::.: :: :: CCDS45 TMVVMVNSTDP-------HGLPNTSTK-KLLDNIKNPMYNWSPDIQGIILSSTSYGVIII 50 60 70 80 90 130 140 150 160 170 180 pF1KE4 QIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRALEGLGEGVTFPAM :.: :: .. . : ..::.. ..::.:. : :: .::. ..: ::..: ..:.. :. CCDS45 QVPVGYFSGIYSTKKMIGFALCLSSVLSLLIPPAAGIGVAWVVVCRAVQGAAQGIVATAQ 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE4 HAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVFYFFGTIGIFWFL .. .:::::::..: :.: .: :: : : ..:.:: ..: .:::.::. : : CCDS45 FEIYVKWAPPLERGRLTSMSTSGFLLGPFIVLLVTGVICESLGWPMVFYIFGACGCAVCL 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE4 LWIWLVSDTPQKHKRISHYEKEYILSSLRNQLSSQK-SVPWVPILKSLPLWAIVVAHFSY ::. : : :. : :: ::::: ::: .:.::.. :.: ::::::.::: .. :.. CCDS45 LWFVLFYDDPKDHPCISISEKEYITSSLVQQVSSSRQSLPIKAILKSLPVWAISTGSFTF 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE4 NWTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAADNLRAKWNFSTL :. . : ... .:. :..::::::::::: .:.: :.:: .: . .. .:.. CCDS45 FWSHNIMTLYTPMFINSMLHVNIKENGFLSSLPYLFAWICGNLAGQLSDFFLTRNILSVI 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE4 CVRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSINHLDIAPSY ::..:. :.. ::.: : ... . : :: .. . :.:: .: :: ::::: : CCDS45 AVRKLFTAAGFLLPAIFGVCLPYLSSTFYSIVIFLILAGATGSFCLGGVFINGLDIAPRY 340 350 360 370 380 390 430 440 450 460 470 pF1KE4 AGILLGITNTFATIPGMVGPVIAKSLT----PDNTVGEWQTVFYIAAAINVFGAIFFTLF .:. .. .:. ::.: .::..:: .. . : .: . ::::: : ::. . CCDS45 ----FGFIKACSTLTGMIGGLIASTLTGLILKQDPESAWFKTFILMAAINVTGLIFYLIV 400 410 420 430 440 450 480 490 pF1KE4 AKGEVQNWALNDHHGHRH : .:.:.:: . .: CCDS45 ATAEIQDWAKEKQHTRL 460 >>CCDS47385.1 SLC17A3 gene_id:10786|Hs108|chr6 (498 aa) initn: 785 init1: 708 opt: 1066 Z-score: 1331.6 bits: 255.9 E(32554): 7.5e-68 Smith-Waterman score: 1066; 34.5% identity (69.6% similar) in 490 aa overlap (3-486:8-490) 10 20 30 40 50 pF1KE4 MRSPVRDLARNDGEESTDRTPLLPGAPRAEAAPVCCSARYNLAILAFFGFFIVYA ::. ..: . ..:.: :.: . .: :::::..:.. : : . : CCDS47 MATKTELSPTARESKNAQDMQVDET-LIP-----RKVPSLCSARYGIALVLHFCNFTTIA 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 LRVNLSVALVDMVDSNTTLED-NRTSKACPEHS--APIKVHHNQTGKK--YQWDAETQGW : .....: ::.:.. . : .:.. : : . :. .. .: :.:. . :: CCDS47 QNVIMNITMVAMVNSTSPQSQLNDSSEVLPVDSFGGLSKAPKSLPAKAPVYDWSPQIQGI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 ILGSFFYGYIITQIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRAL :.:. :: :.:. :.::.:...: : ..:.....:. ::: :.:.:.:. ::: : . CCDS47 IFGAVGYGGILTMAPSGYLAGRVGTKRVVGISLFATSFLTLCIPLATDFGIVLLIVTRIV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 EGLGEGVTFPAMHAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVF .::... . .. :.: .:.:: :::.: ::. .: :: .. ..:.: ..: .:: CCDS47 QGLSQSSILGGQFAIWEKWGPPQERSRLCSIALSGMLLGCFTAILIGGFISETLGWPFVF 180 190 200 210 220 230 240 250 260 270 280 pF1KE4 YFFGTIGIFWFLLWIWLVSDTPQKHKRISHYEKEYILSSLRNQL-SSQKSVPWVPILKSL :.:: .: :::. .. : : .. :: :::::.:::..:. ::.. .: .:.:: CCDS47 YIFGGVGCVCCLLWFVVIYDDPVSYPWISTSEKEYIISSLKQQVGSSKQPLPIKAMLRSL 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE4 PLWAIVVAHFSYNWTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAA :.:.: .. ::..: :... .:::.. . . :...::.::.::.. .:. ...: : CCDS47 PIWSICLGCFSHQWLVSTMVVYIPTYISSVYHVNIRDNGLLSALPFIVAWVIGMVGGYLA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE4 DNLRAKWNFSTLCVRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSG : : .: .: . ::.: ...: . ....:. ... : :.:.::.: :. .:.:: CCDS47 DFLLTK-KFRLITVRKIATILGSLPSSALIVSLPYLNSGYITATALLTLSCGLSTLCQSG 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE4 FSINHLDIAPSYAGILLGITNTFATIPGMVGPVIAKSLTPDNTVGEWQTVFYIAAAINVF . :: ::::: :...:.: . :..: .. :... : .. :..::.. :.:.. CCDS47 IYINVLDIAPRYSSFLMGASRGFSSIAPVIVPTVSGFLLSQDPEFGWRNVFFLLFAVNLL 420 430 440 450 460 470 470 480 490 pF1KE4 GAIFFTLFAKGEVQNWALNDHHGHRH : .:. .:....::.:: CCDS47 GLLFYLIFGEADVQEWAKERKLTRL 480 490 >>CCDS4567.1 SLC17A2 gene_id:10246|Hs108|chr6 (436 aa) initn: 671 init1: 556 opt: 896 Z-score: 1119.7 bits: 216.5 E(32554): 4.8e-56 Smith-Waterman score: 896; 40.5% identity (71.2% similar) in 358 aa overlap (23-372:1-356) 10 20 30 40 50 60 pF1KE4 MRSPVRDLARNDGEESTDRTPLLPGAPRAEAAPVCCSARYNLAILAFFGFFIVYALRVNL . : : .. .: :: ::.::.. :. : . . ::.: CCDS45 MDGKPATRKGPDFCSLRYGLALIMHFSNFTMITQRVSL 10 20 30 70 80 90 100 110 pF1KE4 SVALVDMVD-------SNTTLEDNRTSKACPEHSAPIKVHHNQTGKKYQWDAETQGWILG :.:.. ::. ::.. : . .. : . : :: . . .. :::. :::: :.. CCDS45 SIAIIAMVNTTQQQGLSNASTE-GPVADAFNNSSISIK-EFDTKASVYQWSPETQGIIFS 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 SFFYGYIITQIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRALEGL :. :: :.: ::.::.:. .:.: .:: :.: ...::::::.:::.:: .:..:...:. CCDS45 SINYGIILTLIPSGYLAGIFGAKKMLGAGLLISSLLTLFTPLAADFGVILVIMVRTVQGM 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 GEGVTFPAMHAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVFYFF ..:... .. ..:..:::::::::: .:. .:. .:. : : ..:.: ..: ..::.: CCDS45 AQGMAWTGQFTIWAKWAPPLERSKLTTIAGSGSAFGSFIILCVGGLISQALSWPFIFYIF 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 GTIGIFWFLLWIWLVSDTPQKHKRISHYEKEYILSSLRNQLSSQ-KSVPWVPILKSLPLW :. : :::. .. : :..: :: :::.::::: .: :: ..:: .. :::: CCDS45 GSTGCVCCLLWFTVIYDDPMHHPCISVREKEHILSSLAQQPSSPGRAVPIKAMVTCLPLW 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 AIVVAHFSYNWTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAADNL :: .. ::. : .:: ::::.. .:. :....: :::::.... : ::.:: :: : CCDS45 AIFLGFFSHFWLCTIILTYLPTYISTLLHVNIRDSGVLSSLPFIAAASCTILGGQLADFL 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 RAKWNFSTLCVRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSI .. . . ::..:: . : CCDS45 LSRNLLRLITVRKLFSSLDMQVSSWESQGDLGSSQESSLPLPLDSSSVRILSLVGGMSFS 340 350 360 370 380 390 495 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:52:56 2016 done: Sun Nov 6 00:52:56 2016 Total Scan time: 2.650 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]