FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6465, 539 aa 1>>>pF1KE6465 539 - 539 aa - 539 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1901+/-0.000955; mu= 19.4152+/- 0.057 mean_var=71.8570+/-14.595, 0's: 0 Z-trim(105.5): 31 B-trim: 107 in 1/50 Lambda= 0.151300 statistics sampled from 8464 (8483) to 8464 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.63), E-opt: 0.2 (0.261), width: 16 Scan time: 2.020 The best scores are: opt bits E(32554) CCDS44957.1 SLC17A8 gene_id:246213|Hs108|chr12 ( 539) 3632 802.4 0 CCDS9077.1 SLC17A8 gene_id:246213|Hs108|chr12 ( 589) 2081 463.8 2.4e-130 CCDS7856.1 SLC17A6 gene_id:57084|Hs108|chr11 ( 582) 1531 343.8 3.3e-94 CCDS12764.1 SLC17A7 gene_id:57030|Hs108|chr19 ( 560) 1434 322.6 7.7e-88 CCDS4981.1 SLC17A5 gene_id:26503|Hs108|chr6 ( 495) 598 140.1 6e-33 CCDS4567.1 SLC17A2 gene_id:10246|Hs108|chr6 ( 436) 481 114.5 2.6e-25 CCDS69060.1 SLC17A2 gene_id:10246|Hs108|chr6 ( 478) 481 114.5 2.8e-25 CCDS75411.1 SLC17A4 gene_id:10050|Hs108|chr6 ( 443) 456 109.0 1.2e-23 CCDS4564.1 SLC17A4 gene_id:10050|Hs108|chr6 ( 497) 456 109.1 1.3e-23 CCDS4565.1 SLC17A1 gene_id:6568|Hs108|chr6 ( 467) 443 106.2 8.7e-23 CCDS47385.1 SLC17A3 gene_id:10786|Hs108|chr6 ( 498) 414 99.9 7.4e-21 CCDS4566.2 SLC17A3 gene_id:10786|Hs108|chr6 ( 420) 348 85.4 1.4e-16 CCDS77600.1 SLC17A9 gene_id:63910|Hs108|chr20 ( 430) 276 69.7 7.7e-12 CCDS42901.1 SLC17A9 gene_id:63910|Hs108|chr20 ( 436) 276 69.7 7.8e-12 >>CCDS44957.1 SLC17A8 gene_id:246213|Hs108|chr12 (539 aa) initn: 3632 init1: 3632 opt: 3632 Z-score: 4283.7 bits: 802.4 E(32554): 0 Smith-Waterman score: 3632; 100.0% identity (100.0% similar) in 539 aa overlap (1-539:1-539) 10 20 30 40 50 60 pF1KE6 MPFKAFDTFKEKILKPGKEGVKNAVGDSLGILQRKIDGTTEEEDNIELNEEGRPVQTSRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MPFKAFDTFKEKILKPGKEGVKNAVGDSLGILQRKIDGTTEEEDNIELNEEGRPVQTSRP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 SPPLCDCHCCGLPKRYIIAIMSGLGFCISFGIRCNLGVAIVEMVNNSTVYVDGKPEIQTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SPPLCDCHCCGLPKRYIIAIMSGLGFCISFGIRCNLGVAIVEMVNNSTVYVDGKPEIQTA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 QFNWDPETVGLIHGSFFWGYIMTQIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QFNWDPETVGLIHGSFFWGYIMTQIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 HYGCVMCVRILQGLVEGVTYPACHGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HYGCVMCVRILQGLVEGVTYPACHGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 LVQYIGWSSVFYIYGMFGIIWYMFWLLQAYECPAAHPTISNEEKTYIETSIGEGANVVSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LVQYIGWSSVFYIYGMFGIIWYMFWLLQAYECPAAHPTISNEEKTYIETSIGEGANVVSL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 SVGLLSAVPHMVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNCGGFGMEATLLLVVGFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SVGLLSAVPHMVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNCGGFGMEATLLLVVGFS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 HTKGVAISFLVLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPLIVGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HTKGVAISFLVLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPLIVGA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 MTRHKTREEWQNVFLIAALVHYSGVIFYGVFASGEKQEWADPENLSEEKCGIIDQDELAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MTRHKTREEWQNVFLIAALVHYSGVIFYGVFASGEKQEWADPENLSEEKCGIIDQDELAE 430 440 450 460 470 480 490 500 510 520 530 pF1KE6 EIELNHESFASPKKKMSYGATSQNCEVQKKEWKGQRGATLDEEELTSYQNEERNFSTIS ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EIELNHESFASPKKKMSYGATSQNCEVQKKEWKGQRGATLDEEELTSYQNEERNFSTIS 490 500 510 520 530 >>CCDS9077.1 SLC17A8 gene_id:246213|Hs108|chr12 (589 aa) initn: 3618 init1: 2081 opt: 2081 Z-score: 2453.5 bits: 463.8 E(32554): 2.4e-130 Smith-Waterman score: 3413; 91.2% identity (91.2% similar) in 571 aa overlap (1-521:1-571) 10 20 30 40 50 60 pF1KE6 MPFKAFDTFKEKILKPGKEGVKNAVGDSLGILQRKIDGTTEEEDNIELNEEGRPVQTSRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MPFKAFDTFKEKILKPGKEGVKNAVGDSLGILQRKIDGTTEEEDNIELNEEGRPVQTSRP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 SPPLCDCHCCGLPKRYIIAIMSGLGFCISFGIRCNLGVAIVEMVNNSTVYVDGKPEIQTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 SPPLCDCHCCGLPKRYIIAIMSGLGFCISFGIRCNLGVAIVEMVNNSTVYVDGKPEIQTA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 QFNWDPETVGLIHGSFFWGYIMTQIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 QFNWDPETVGLIHGSFFWGYIMTQIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 HYGCVMCVRILQGLVEGVTYPACHGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 HYGCVMCVRILQGLVEGVTYPACHGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 LVQYIGWSSVFYIYGMFGIIWYMFWLLQAYECPAAHPTISNEEKTYIETSIGEGANVVSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 LVQYIGWSSVFYIYGMFGIIWYMFWLLQAYECPAAHPTISNEEKTYIETSIGEGANVVSL 250 260 270 280 290 300 310 pF1KE6 S--------------------------------------------------VGLLSAVPH : ::::::::: CCDS90 SKFSTPWKRFFTSLPVYAIIVANFCRSWTFYLLLISQPAYFEEVFGFAISKVGLLSAVPH 310 320 330 340 350 360 320 330 340 350 360 370 pF1KE6 MVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNCGGFGMEATLLLVVGFSHTKGVAISFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNCGGFGMEATLLLVVGFSHTKGVAISFL 370 380 390 400 410 420 380 390 400 410 420 430 pF1KE6 VLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPLIVGAMTRHKTREEW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPLIVGAMTRHKTREEW 430 440 450 460 470 480 440 450 460 470 480 490 pF1KE6 QNVFLIAALVHYSGVIFYGVFASGEKQEWADPENLSEEKCGIIDQDELAEEIELNHESFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 QNVFLIAALVHYSGVIFYGVFASGEKQEWADPENLSEEKCGIIDQDELAEEIELNHESFA 490 500 510 520 530 540 500 510 520 530 pF1KE6 SPKKKMSYGATSQNCEVQKKEWKGQRGATLDEEELTSYQNEERNFSTIS ::::::::::::::::::::::::::::::: CCDS90 SPKKKMSYGATSQNCEVQKKEWKGQRGATLDEEELTSYQNEERNFSTIS 550 560 570 580 >>CCDS7856.1 SLC17A6 gene_id:57084|Hs108|chr11 (582 aa) initn: 2593 init1: 1531 opt: 1531 Z-score: 1804.7 bits: 343.8 E(32554): 3.3e-94 Smith-Waterman score: 2496; 67.2% identity (81.3% similar) in 561 aa overlap (7-513:2-559) 10 20 30 40 50 60 pF1KE6 MPFKAFDTFKEKILKPGKEGVKNAVGDSLGILQRKIDGTTEEEDNIELNEEGRPVQTSRP .. :..:: :::::.:: .: ::: . : .. . ..:::.:.:.:... . CCDS78 MESVKQRILAPGKEGLKNFAGKSLGQIYRVLEKKQDTGETIELTEDGKPLEVPER 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 SPPLCDCHCCGLPKRYIIAIMSGLGFCISFGIRCNLGVAIVEMVNNSTVYVDGKPEIQTA . ::::: : :::.:::::::::::::::::::::::::::.::::::.. :: . : CCDS78 KAPLCDCTCFGLPRRYIIAIMSGLGFCISFGIRCNLGVAIVDMVNNSTIHRGGKVIKEKA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 QFNWDPETVGLIHGSFFWGYIMTQIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARV .:::::::::.::::::::::.::::::.:....::::::::::.:::::::.::::::: CCDS78 KFNWDPETVGMIHGSFFWGYIITQIPGGYIASRLAANRVFGAAILLTSTLNMLIPSAARV 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 HYGCVMCVRILQGLVEGVTYPACHGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGV :::::. ::::::::::::::::::.::::::::::::::::::::::::::.::::::. CCDS78 HYGCVIFVRILQGLVEGVTYPACHGIWSKWAPPLERSRLATTSFCGSYAGAVIAMPLAGI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE6 LVQYIGWSSVFYIYGMFGIIWYMFWLLQAYECPAAHPTISNEEKTYIETSIGEGANVVSL :::: :::::::.:: ::..::::::: .:: :: ::::..::. ::: ::::.::... CCDS78 LVQYTGWSSVFYVYGSFGMVWYMFWLLVSYESPAKHPTITDEERRYIEESIGESANLLGA 240 250 260 270 280 290 pF1KE6 ---------------------------------------------------SVGLLSAVP .::.::::: CCDS78 MEKFKTPWRKFFTSMPVYAIIVANFCRSWTFYLLLISQPAYFEEVFGFEISKVGMLSAVP 300 310 320 330 340 350 310 320 330 340 350 360 pF1KE6 HMVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNCGGFGMEATLLLVVGFSHTKGVAISF :.::::.::::::.::.:::.:::.::.:::::::::::::::::::::.:::.:::::: CCDS78 HLVMTIIVPIGGQIADFLRSKQILSTTTVRKIMNCGGFGMEATLLLVVGYSHTRGVAISF 360 370 380 390 400 410 370 380 390 400 410 420 pF1KE6 LVLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPLIVGAMTRHKTREE ::::::::::::::::::::::::::::::::::::::::::::::.::::::..:.::: CCDS78 LVLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPIIVGAMTKNKSREE 420 430 440 450 460 470 430 440 450 460 470 480 pF1KE6 WQNVFLIAALVHYSGVIFYGVFASGEKQEWADPENLSEEKCGIIDQDELAEE---IELNH :: ::::::::::.:::::..::::::: :::::. ::::::.: .::: :: : :. CCDS78 WQYVFLIAALVHYGGVIFYAIFASGEKQPWADPEETSEEKCGFIHEDELDEETGDITQNY 480 490 500 510 520 530 490 500 510 520 530 pF1KE6 ESFASPKKKMSYGATSQNCEVQKKEWKGQRGATLDEEELTSYQNEERNFSTIS .... : :::::.: . :. CCDS78 INYGTTK---SYGATTQANGGWPSGWEKKEEFVQGEVQDSHSYKDRVDYS 540 550 560 570 580 >>CCDS12764.1 SLC17A7 gene_id:57030|Hs108|chr19 (560 aa) initn: 2461 init1: 1434 opt: 1434 Z-score: 1690.5 bits: 322.6 E(32554): 7.7e-88 Smith-Waterman score: 2382; 67.8% identity (80.7% similar) in 540 aa overlap (18-501:5-544) 10 20 30 40 50 60 pF1KE6 MPFKAFDTFKEKILKPGKEGVKNAVGDSLGILQRKIDGTTEEEDNIELNEEGRPVQTSRP .: .. .: .:: :.: .. : ...::. .:::: :. CCDS12 MEFRQEEFRKLAGRALGKLHRLLEKRQEGAETLELSADGRPVTTQTR 10 20 30 40 70 80 90 100 110 120 pF1KE6 SPPLCDCHCCGLPKRYIIAIMSGLGFCISFGIRCNLGVAIVEMVNNSTVYVDGKPEIQTA .::. :: : :::.::::::::::::::::::::::::::: ::::::.. :. .: : CCDS12 DPPVVDCTCFGLPRRYIIAIMSGLGFCISFGIRCNLGVAIVSMVNNSTTHRGGHVVVQKA 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE6 QFNWDPETVGLIHGSFFWGYIMTQIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARV ::.::::::::::::::::::.:::::::: .::::::::: :: ::::::.::::::: CCDS12 QFSWDPETVGLIHGSFFWGYIVTQIPGGFICQKFAANRVFGFAIVATSTLNMLIPSAARV 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE6 HYGCVMCVRILQGLVEGVTYPACHGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGV :::::. ::::::::::::::::::.::::::::::::::::.::::::::::::::::: CCDS12 HYGCVIFVRILQGLVEGVTYPACHGIWSKWAPPLERSRLATTAFCGSYAGAVVAMPLAGV 170 180 190 200 210 220 250 260 270 280 290 pF1KE6 LVQYIGWSSVFYIYGMFGIIWYMFWLLQAYECPAAHPTISNEEKTYIETSIGEGANVVS- :::: :::::::.:: :::.::.:::: .:: :: ::.::.::. ::: .:::.:.... CCDS12 LVQYSGWSSVFYVYGSFGIFWYLFWLLVSYESPALHPSISEEERKYIEDAIGESAKLMNP 230 240 250 260 270 280 300 pF1KE6 LS--------------------------------------------------VGLLSAVP :. :::.::.: CCDS12 LTKFSTPWRRFFTSMPVYAIIVANFCRSWTFYLLLISQPAYFEEVFGFEISKVGLVSALP 290 300 310 320 330 340 310 320 330 340 350 360 pF1KE6 HMVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNCGGFGMEATLLLVVGFSHTKGVAISF :.::::.::::::.::.::::.:..:: :::.:::::::::::::::::.::.::::::: CCDS12 HLVMTIIVPIGGQIADFLRSRRIMSTTNVRKLMNCGGFGMEATLLLVVGYSHSKGVAISF 350 360 370 380 390 400 370 380 390 400 410 420 pF1KE6 LVLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPLIVGAMTRHKTREE ::::::::::::::::::::::::::::::::::::::::::::::.::::::.:::::: CCDS12 LVLAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPIIVGAMTKHKTREE 410 420 430 440 450 460 430 440 450 460 470 480 pF1KE6 WQNVFLIAALVHYSGVIFYGVFASGEKQEWADPENLSEEKCGIIDQDELA--EEIELNHE :: :::::.::::.:::::::::::::: ::.::..::::::.. .:.:: .. :.. : CCDS12 WQYVFLIASLVHYGGVIFYGVFASGEKQPWAEPEEMSEEKCGFVGHDQLAGSDDSEMEDE 470 480 490 500 510 520 490 500 510 520 530 pF1KE6 SF---ASPKKKMSYGATSQNCEVQKKEWKGQRGATLDEEELTSYQNEERNFSTIS . : : ::::: CCDS12 AEPPGAPPAPPPSYGATHSTFQPPRPPPPVRDY 530 540 550 560 >>CCDS4981.1 SLC17A5 gene_id:26503|Hs108|chr6 (495 aa) initn: 1112 init1: 598 opt: 598 Z-score: 705.0 bits: 140.1 E(32554): 6e-33 Smith-Waterman score: 1004; 37.9% identity (66.7% similar) in 454 aa overlap (69-460:35-486) 40 50 60 70 80 90 pF1KE6 TTEEEDNIELNEEGRPVQTSRPSPPLCDCHCCGLPKRYIIAIMSGLGFCISFGIRCNLGV ::. :: .::.. .:: : ...: ::.: CCDS49 VRDLARNDGEESTDRTPLLPGAPRAEAAPVCCS--ARYNLAILAFFGFFIVYALRVNLSV 10 20 30 40 50 60 100 110 120 130 140 pF1KE6 AIVEMVNNSTVYVDGK-----PE---------IQTAQ-FNWDPETVGLIHGSFFWGYIMT :.:.::...:. :.. :: ::.. ..:: :: : : ::::.:::.: CCDS49 ALVDMVDSNTTLEDNRTSKACPEHSAPIKVHHNQTGKKYQWDAETQGWILGSFFYGYIIT 70 80 90 100 110 120 150 160 170 180 190 200 pF1KE6 QIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARVHYGCVMCVRILQGLVEGVTYPAC :::::....:.... ..: .:. :..:..: : :: . : .. .: :.:: ::::.:: CCDS49 QIPGGYVASKIGGKMLLGFGILGTAVLTLFTPIAADLGVGPLIVLRALEGLGEGVTFPAM 130 140 150 160 170 180 210 220 230 240 250 260 pF1KE6 HGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGVLVQYIGWSSVFYIYGMFGIIWYM :.:::.::::::::.: . :. :. :.:...::.:.. :..:. :::..: .::.:.. CCDS49 HAMWSSWAPPLERSKLLSISYAGAQLGTVISLPLSGIICYYMNWTYVFYFFGTIGIFWFL 190 200 210 220 230 240 270 280 290 pF1KE6 FWLLQAYECPAAHPTISNEEKTYIETSIGEG-------------------ANVVS----- .:. . . : : ::. :: :: .:. . : ::. CCDS49 LWIWLVSDTPQKHKRISHYEKEYILSSLRNQLSSQKSVPWVPILKSLPLWAIVVAHFSYN 250 260 270 280 290 300 300 310 320 330 pF1KE6 ------LSV----------------GLLSAVPHMVMTIVVPIGGQLADYLRSRQILTTTA :.. :.::..:.. . . ..:: :: ::.. ..: CCDS49 WTFYTLLTLLPTYMKEILRFNVQENGFLSSLPYLGSWLCMILSGQAADNLRAKWNFSTLC 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE6 VRKIMNCGGFGMEATLLLVVGF-SHTKGVAISFLVLAVGFSGFAISGFNVNHLDIAPRYA ::.:.. :. :..:...:: . ..:..::.... ..:: :::..::::::: :: CCDS49 VRRIFSLIGMIGPAVFLVAAGFIGCDYSLAVAFLTISTTLGGFCSSGFSINHLDIAPSYA 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE6 SILMGISNGVGTLSGMVCPLIVGAMTRHKTREEWQNVFLIAALVHYSGVIFYGVFASGEK .::.::.: .:. ::: :.:. ..: .: :::.:: ::: .. :.::. .::.:: CCDS49 GILLGITNTFATIPGMVGPVIAKSLTPDNTVGEWQTVFYIAAAINVFGAIFFTLFAKGEV 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE6 QEWADPENLSEEKCGIIDQDELAEEIELNHESFASPKKKMSYGATSQNCEVQKKEWKGQR :.:: CCDS49 QNWALNDHHGHRH 490 >>CCDS4567.1 SLC17A2 gene_id:10246|Hs108|chr6 (436 aa) initn: 610 init1: 439 opt: 481 Z-score: 567.8 bits: 114.5 E(32554): 2.6e-25 Smith-Waterman score: 485; 30.0% identity (61.4% similar) in 290 aa overlap (51-319:2-275) 30 40 50 60 70 80 pF1KE6 VKNAVGDSLGILQRKIDGTTEEEDNIELNEEGRPVQTSRPSPPLCDCHCCGLPKRYIIAI .:.: ..: .: .:. :: .:. CCDS45 MDGKP--ATRKGPDFCSL-------RYGLAL 10 20 90 100 110 pF1KE6 MSGLGFCISFGIRCNLGVAIVEMVN---------------------NSTVYVDGKPEIQT . .. . : .:..::. ::: ::.. . . . .. CCDS45 IMHFSNFTMITQRVSLSIAIIAMVNTTQQQGLSNASTEGPVADAFNNSSISIK-EFDTKA 30 40 50 60 70 80 120 130 140 150 160 170 pF1KE6 AQFNWDPETVGLIHGSFFWGYIMTQIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAAR . ..:.::: :.: .:. .: :.: ::.:.... :.:....::.....: :..: : :: CCDS45 SVYQWSPETQGIIFSSINYGIILTLIPSGYLAGIFGAKKMLGAGLLISSLLTLFTPLAAD 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE6 VHYGCVMCVRILQGLVEGVTYPACHGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAG :. :: .::...:... . .:.:::::::::.:.: . :: :. . . ..: CCDS45 FGVILVIMVRTVQGMAQGMAWTGQFTIWAKWAPPLERSKLTTIAGSGSAFGSFIILCVGG 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE6 VLVQYIGWSSVFYIYGMFGIIWYMFWLLQAYECPAAHPTISNEEKTYIETSIGEGANVVS .. : ..: .:::.: : . ..:. :. : :: :: .:: .: .:... . CCDS45 LISQALSWPFIFYIFGSTGCVCCLLWFTVIYDDPMHHPCISVREKEHILSSLAQQPS--- 210 220 230 240 250 300 310 320 330 340 350 pF1KE6 LSVGLLSAVPHMVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNCGGFGMEATLLLVVGF : : ::: .:. .:. CCDS45 -SPG--RAVPIKAMVTCLPLWAIFLGFFSHFWLCTIILTYLPTYISTLLHVNIRDSGVLS 260 270 280 290 300 310 >>CCDS69060.1 SLC17A2 gene_id:10246|Hs108|chr6 (478 aa) initn: 829 init1: 439 opt: 481 Z-score: 567.2 bits: 114.5 E(32554): 2.8e-25 Smith-Waterman score: 755; 29.9% identity (59.2% similar) in 485 aa overlap (51-466:2-476) 30 40 50 60 70 80 pF1KE6 VKNAVGDSLGILQRKIDGTTEEEDNIELNEEGRPVQTSRPSPPLCDCHCCGLPKRYIIAI .:.: ..: .: .:. :: .:. CCDS69 MDGKP--ATRKGPDFCSL-------RYGLAL 10 20 90 100 110 pF1KE6 MSGLGFCISFGIRCNLGVAIVEMVN---------------------NSTVYVDGKPEIQT . .. . : .:..::. ::: ::.. . . . .. CCDS69 IMHFSNFTMITQRVSLSIAIIAMVNTTQQQGLSNASTEGPVADAFNNSSISIK-EFDTKA 30 40 50 60 70 80 120 130 140 150 160 170 pF1KE6 AQFNWDPETVGLIHGSFFWGYIMTQIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAAR . ..:.::: :.: .:. .: :.: ::.:.... :.:....::.....: :..: : :: CCDS69 SVYQWSPETQGIIFSSINYGIILTLIPSGYLAGIFGAKKMLGAGLLISSLLTLFTPLAAD 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE6 VHYGCVMCVRILQGLVEGVTYPACHGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAG :. :: .::...:... . .:.:::::::::.:.: . :: :. . . ..: CCDS69 FGVILVIMVRTVQGMAQGMAWTGQFTIWAKWAPPLERSKLTTIAGSGSAFGSFIILCVGG 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE6 VLVQYIGWSSVFYIYGMFGIIWYMFWLLQAYECPAAHPTISNEEKTYIETSIGEG----- .. : ..: .:::.: : . ..:. :. : :: :: .:: .: .:... CCDS69 LISQALSWPFIFYIFGSTGCVCCLLWFTVIYDDPMHHPCISVREKEHILSSLAQQPSSPG 210 220 230 240 250 260 300 310 pF1KE6 ------ANVVSLSV------------------------------------GLLSAVPHMV : :. : . :.::..: .. CCDS69 RAVPIKAMVTCLPLWAIFLGFFSHFWLCTIILTYLPTYISTLLHVNIRDSGVLSSLPFIA 270 280 290 300 310 320 320 330 340 350 360 370 pF1KE6 MTIVVPIGGQLADYLRSRQILTTTAVRKIMNCGGFGMEATLLLVVGFSHTKGV-AISFLV . . .::::::.: ::..: .:::... :. . . ... : .. : .: .:. CCDS69 AASCTILGGQLADFLLSRNLLRLITVRKLFSSLGLLLPSICAVALPFVASSYVITIILLI 330 340 350 360 370 380 380 390 400 410 420 430 pF1KE6 LAVGFSGFAISGFNVNHLDIAPRYASILMGISNGVGTLSGMVCPLIVGAMTRHKTREEWQ : : :.. ::: .: :::::::::.::::: : : ..:.. .: . . . :. CCDS69 LIPGTSNLCDSGFIINTLDIAPRYASFLMGISRGFGLIAGIISSTATGFLISQDFESGWR 390 400 410 420 430 440 440 450 460 470 480 490 pF1KE6 NVFLIAALVHYSGVIFYGVFASGEKQEWADPENLSEEKCGIIDQDELAEEIELNHESFAS :::...: :.. :..:: .:...: :.:: ..:. CCDS69 NVFFLSAAVNMFGLVFYLTFGQAELQDWAKERTLTRL 450 460 470 500 510 520 530 pF1KE6 PKKKMSYGATSQNCEVQKKEWKGQRGATLDEEELTSYQNEERNFSTIS >>CCDS75411.1 SLC17A4 gene_id:10050|Hs108|chr6 (443 aa) initn: 794 init1: 432 opt: 456 Z-score: 538.2 bits: 109.0 E(32554): 1.2e-23 Smith-Waterman score: 712; 32.3% identity (62.6% similar) in 393 aa overlap (122-466:49-441) 100 110 120 130 140 150 pF1KE6 IRCNLGVAIVEMVNNSTVYVDGKPEIQTAQFNWDPETVGLIHGSFFWGYIMTQIPGGFIS ..:.:: :.: .:. .: ... ::.:... CCDS75 QPNASTERPSTDSQGYWNETLKEFKAMAPAYDWSPEIQGIILSSLNYGSFLAPIPSGYVA 20 30 40 50 60 70 160 170 180 190 200 210 pF1KE6 NKFAANRVFGAAIFLTSTLNMFIPSAARVHYGCVMCVRILQGLVEGVTYPACHGMWSKWA . :.:. : ::..:..: :..::: :: . . .. .::.::... .. . ...: ::: CCDS75 GIFGAKYVVGAGLFISSFLTLFIPLAANAGVALLIVLRIVQGIAQVMVLTGQYSIWVKWA 80 90 100 110 120 130 220 230 240 250 260 270 pF1KE6 PPLERSRLATTSFCGSYAGAVVAMPLAGVLVQYIGWSSVFYIYGMFGIIWYMFWLLQAYE ::::::.:.: . ::. :. ... .:.: : ::: ::::.: .: .:. :. CCDS75 PPLERSQLTTIAGSGSMLGSFIVLLAGGLLCQTIGWPYVFYIFGGIGCACCPLWFPLIYD 140 150 160 170 180 190 280 290 300 pF1KE6 CPAAHPTISNEEKTYIETSIGEG-----------ANVVSLSV------------------ :. :: :: :: :: :... : . :: . CCDS75 DPVNHPFISAGEKRYIVCSLAQQDCSPGWSLPIRAMIKSLPLWAILVSYFCEYWLFYTIM 200 210 220 230 240 250 310 320 330 340 pF1KE6 ------------------GLLSAVPHMVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNC :.:::.: .: : . .:: :::.: ::.:: ..::... CCDS75 AYTPTYISSVLQANLRDSGILSALPFVVGCICIILGGLLADFLLSRKILRLITIRKLFTA 260 270 280 290 300 310 350 360 370 380 390 400 pF1KE6 GGFGMEATLLLVVGFSHTK-GVAISFLVLAVGFSGFAISGFNVNHLDIAPRYASILMGIS : . ...:. . . ... .....::::. ..:.: :: :: :::::::...: :. CCDS75 IGVLFPSVILVSLPWVRSSHSMTMTFLVLSSAISSFCESGALVNFLDIAPRYTGFLKGLL 320 330 340 350 360 370 410 420 430 440 450 460 pF1KE6 NGVGTLSGMVCPLIVGAMTRHKTREEWQNVFLIAALVHYSGVIFYGVFASGEKQEWADPE . . ..: . : .: . . .. :.::::..: :. ::..:: .:. .. :.:: . CCDS75 QVFAHIAGAISPTAAGFFISQDSEFGWRNVFLLSAAVNISGLVFYLIFGRADVQDWAKEQ 380 390 400 410 420 430 470 480 490 500 510 520 pF1KE6 NLSEEKCGIIDQDELAEEIELNHESFASPKKKMSYGATSQNCEVQKKEWKGQRGATLDEE ... CCDS75 TFTHL 440 >>CCDS4564.1 SLC17A4 gene_id:10050|Hs108|chr6 (497 aa) initn: 815 init1: 453 opt: 456 Z-score: 537.5 bits: 109.1 E(32554): 1.3e-23 Smith-Waterman score: 712; 32.3% identity (62.6% similar) in 393 aa overlap (122-466:103-495) 100 110 120 130 140 150 pF1KE6 IRCNLGVAIVEMVNNSTVYVDGKPEIQTAQFNWDPETVGLIHGSFFWGYIMTQIPGGFIS ..:.:: :.: .:. .: ... ::.:... CCDS45 QPNASTERPSTDSQGYWNETLKEFKAMAPAYDWSPEIQGIILSSLNYGSFLAPIPSGYVA 80 90 100 110 120 130 160 170 180 190 200 210 pF1KE6 NKFAANRVFGAAIFLTSTLNMFIPSAARVHYGCVMCVRILQGLVEGVTYPACHGMWSKWA . :.:. : ::..:..: :..::: :: . . .. .::.::... .. . ...: ::: CCDS45 GIFGAKYVVGAGLFISSFLTLFIPLAANAGVALLIVLRIVQGIAQVMVLTGQYSIWVKWA 140 150 160 170 180 190 220 230 240 250 260 270 pF1KE6 PPLERSRLATTSFCGSYAGAVVAMPLAGVLVQYIGWSSVFYIYGMFGIIWYMFWLLQAYE ::::::.:.: . ::. :. ... .:.: : ::: ::::.: .: .:. :. CCDS45 PPLERSQLTTIAGSGSMLGSFIVLLAGGLLCQTIGWPYVFYIFGGIGCACCPLWFPLIYD 200 210 220 230 240 250 280 290 300 pF1KE6 CPAAHPTISNEEKTYIETSIGEG-----------ANVVSLSV------------------ :. :: :: :: :: :... : . :: . CCDS45 DPVNHPFISAGEKRYIVCSLAQQDCSPGWSLPIRAMIKSLPLWAILVSYFCEYWLFYTIM 260 270 280 290 300 310 310 320 330 340 pF1KE6 ------------------GLLSAVPHMVMTIVVPIGGQLADYLRSRQILTTTAVRKIMNC :.:::.: .: : . .:: :::.: ::.:: ..::... CCDS45 AYTPTYISSVLQANLRDSGILSALPFVVGCICIILGGLLADFLLSRKILRLITIRKLFTA 320 330 340 350 360 370 350 360 370 380 390 400 pF1KE6 GGFGMEATLLLVVGFSHTK-GVAISFLVLAVGFSGFAISGFNVNHLDIAPRYASILMGIS : . ...:. . . ... .....::::. ..:.: :: :: :::::::...: :. CCDS45 IGVLFPSVILVSLPWVRSSHSMTMTFLVLSSAISSFCESGALVNFLDIAPRYTGFLKGLL 380 390 400 410 420 430 410 420 430 440 450 460 pF1KE6 NGVGTLSGMVCPLIVGAMTRHKTREEWQNVFLIAALVHYSGVIFYGVFASGEKQEWADPE . . ..: . : .: . . .. :.::::..: :. ::..:: .:. .. :.:: . CCDS45 QVFAHIAGAISPTAAGFFISQDSEFGWRNVFLLSAAVNISGLVFYLIFGRADVQDWAKEQ 440 450 460 470 480 490 470 480 490 500 510 520 pF1KE6 NLSEEKCGIIDQDELAEEIELNHESFASPKKKMSYGATSQNCEVQKKEWKGQRGATLDEE ... CCDS45 TFTHL >>CCDS4565.1 SLC17A1 gene_id:6568|Hs108|chr6 (467 aa) initn: 713 init1: 386 opt: 443 Z-score: 522.5 bits: 106.2 E(32554): 8.7e-23 Smith-Waterman score: 680; 29.5% identity (58.9% similar) in 455 aa overlap (72-460:7-459) 50 60 70 80 90 pF1KE6 EEDNIELNEEGRPVQTSRPSPPLCDCHCCGLPKRYIIAIMS---GLGF---CISFGI--- :: . . .. : ::.: : . : CCDS45 MQMDNRLPPKKVPGFCSFRYGLSFLVHCCNVIITAQ 10 20 30 100 110 120 130 140 pF1KE6 RCNLGVAIVEMVNNSTVYVDGKPE---------IQTAQFNWDPETVGLIHGSFFWGYIMT : :....: :::.. . : :. :.. ..::.:. :.: .: .: :. CCDS45 RACLNLTMVVMVNSTDPH--GLPNTSTKKLLDNIKNPMYNWSPDIQGIILSSTSYGVIII 40 50 60 70 80 90 150 160 170 180 190 200 pF1KE6 QIPGGFISNKFAANRVFGAAIFLTSTLNMFIPSAARVHYGCVMCVRILQGLVEGVTYPAC :.: :..:. .......: :. :.:.:...:: :: . . :. : .:: ..:.. : CCDS45 QVPVGYFSGIYSTKKMIGFALCLSSVLSLLIPPAAGIGVAWVVVCRAVQGAAQGIVATAQ 100 110 120 130 140 150 210 220 230 240 250 260 pF1KE6 HGMWSKWAPPLERSRLATTSFCGSYAGAVVAMPLAGVLVQYIGWSSVFYIYGMFGIIWYM .. ::::::::.::.. : : : ... ..::. . .:: ::::.: : . CCDS45 FEIYVKWAPPLERGRLTSMSTSGFLLGPFIVLLVTGVICESLGWPMVFYIFGACGCAVCL 160 170 180 190 200 210 270 280 290 pF1KE6 FWLLQAYECPAAHPTISNEEKTYIETS-------------------------IGEGA--- .:.. :. : :: :: :: :: .: :. :. CCDS45 LWFVLFYDDPKDHPCISISEKEYITSSLVQQVSSSRQSLPIKAILKSLPVWAISTGSFTF 220 230 240 250 260 270 300 310 320 330 pF1KE6 ----NVVSLSV---------------GLLSAVPHMVMTIVVPIGGQLADYLRSRQILTTT :...: . :.::..:.. : ..:::.:.. .:.::.. CCDS45 FWSHNIMTLYTPMFINSMLHVNIKENGFLSSLPYLFAWICGNLAGQLSDFFLTRNILSVI 280 290 300 310 320 330 340 350 360 370 380 390 pF1KE6 AVRKIMNCGGFGMEATLLLVVGF-SHTKGVAISFLVLAVGFSGFAISGFNVNHLDIAPRY ::::... .:: . : . . . . : : . ::.:: . ..: ..: .: ::::::: CCDS45 AVRKLFTAAGFLLPAIFGVCLPYLSSTFYSIVIFLILAGATGSFCLGGVFINGLDIAPRY 340 350 360 370 380 390 400 410 420 430 440 450 pF1KE6 ASILMGISNGVGTLSGMVCPLIVGAMTRHKTREEWQNVFLIAALVHYSGVIFYGVFASGE ... . :. .: ..:.. ..: . .. . : ..:.. : .. .:.::: . :..: CCDS45 FGFIKACSTLTGMIGGLIASTLTGLILKQDPESAWFKTFILMAAINVTGLIFYLIVATAE 400 410 420 430 440 450 460 470 480 490 500 510 pF1KE6 KQEWADPENLSEEKCGIIDQDELAEEIELNHESFASPKKKMSYGATSQNCEVQKKEWKGQ :.:: CCDS45 IQDWAKEKQHTRL 460 539 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:33:34 2016 done: Tue Nov 8 13:33:35 2016 Total Scan time: 2.020 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]