FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6478, 483 aa 1>>>pF1KE6478 483 - 483 aa - 483 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6891+/-0.00105; mu= 15.7838+/- 0.062 mean_var=67.5166+/-14.072, 0's: 0 Z-trim(102.9): 34 B-trim: 457 in 1/49 Lambda= 0.156088 statistics sampled from 7147 (7170) to 7147 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.575), E-opt: 0.2 (0.22), width: 16 Scan time: 2.660 The best scores are: opt bits E(32554) CCDS4315.1 SLC36A2 gene_id:153201|Hs108|chr5 ( 483) 3131 714.4 6.5e-206 CCDS4316.1 SLC36A1 gene_id:206358|Hs108|chr5 ( 476) 2204 505.7 4.4e-143 CCDS4314.1 SLC36A3 gene_id:285641|Hs108|chr5 ( 470) 1782 410.7 1.8e-114 CCDS83035.1 SLC36A1 gene_id:206358|Hs108|chr5 ( 386) 1764 406.6 2.5e-113 CCDS8291.1 SLC36A4 gene_id:120103|Hs108|chr11 ( 504) 1557 360.0 3.4e-99 CCDS47316.1 SLC36A3 gene_id:285641|Hs108|chr5 ( 511) 1370 317.9 1.6e-86 CCDS66202.1 SLC36A4 gene_id:120103|Hs108|chr11 ( 369) 1223 284.7 1.1e-76 CCDS78073.1 SLC36A1 gene_id:206358|Hs108|chr5 ( 243) 1074 251.1 9.7e-67 >>CCDS4315.1 SLC36A2 gene_id:153201|Hs108|chr5 (483 aa) initn: 3131 init1: 3131 opt: 3131 Z-score: 3810.3 bits: 714.4 E(32554): 6.5e-206 Smith-Waterman score: 3131; 100.0% identity (100.0% similar) in 483 aa overlap (1-483:1-483) 10 20 30 40 50 60 pF1KE6 MSVTKSTEGPQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKKTKGITVFQAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MSVTKSTEGPQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKKTKGITVFQAL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IHLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRFCKRLNKPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IHLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRFCKRLNKPF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 MDYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLGFCCVYIVFLADNLKQVVEAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MDYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLGFCCVYIVFLADNLKQVVEAV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 NSTTNNCYSNETVILTPTMDSRLYMLSFLPFLVLLVLIRNLRILTIFSMLANISMLVSLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NSTTNNCYSNETVILTPTMDSRLYMLSFLPFLVLLVLIRNLRILTIFSMLANISMLVSLV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 IIIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSFESIGVVLPLENKMKNARHFPAILS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IIIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSFESIGVVLPLENKMKNARHFPAILS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 LGMSIVTSLYIGMAALGYLRFGDDIKASISLNLPNCWLYQSVKLLYIAGILCTYALQFYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LGMSIVTSLYIGMAALGYLRFGDDIKASISLNLPNCWLYQSVKLLYIAGILCTYALQFYV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 PAEIIIPFAISRVSTRWALPLDLSIRLVMVCLTCLLAILIPRLDLVISLVGSVSGTALAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PAEIIIPFAISRVSTRWALPLDLSIRLVMVCLTCLLAILIPRLDLVISLVGSVSGTALAL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 IIPPLLEVTTFYSEGMSPLTIFKDALISILGFVGFVVGTYQALDELLKSEDSHPFSNSTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IIPPLLEVTTFYSEGMSPLTIFKDALISILGFVGFVVGTYQALDELLKSEDSHPFSNSTT 430 440 450 460 470 480 pF1KE6 FVR ::: CCDS43 FVR >>CCDS4316.1 SLC36A1 gene_id:206358|Hs108|chr5 (476 aa) initn: 2197 init1: 2197 opt: 2204 Z-score: 2682.2 bits: 505.7 E(32554): 4.4e-143 Smith-Waterman score: 2204; 73.0% identity (89.5% similar) in 459 aa overlap (21-479:19-472) 10 20 30 40 50 60 pF1KE6 MSVTKSTEGPQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKKTKGITVFQAL .:: :: .. :. : ::. . .... : ::.: CCDS43 MSTQRLRNEDYHDYSSTDVSPEESPSEGLNNLS-----SPGSYQRFGQSNSTTWFQTL 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 IHLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRFCKRLNKPF :::.:::.:::.::::::::::::.:::.:::..:..: ::: ::::::..::.:::: : CCDS43 IHLLKGNIGTGLLGLPLAVKNAGIVMGPISLLIIGIVAVHCMGILVKCAHHFCRRLNKSF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 MDYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLGFCCVYIVFLADNLKQVVEAV .:::::::.:::..: .::.:::::::..:.::::.:::::::::.::::::.:::.::. CCDS43 VDYGDTVMYGLESSPCSWLRNHAHWGRRVVDFFLIVTQLGFCCVYFVFLADNFKQVIEAA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 NSTTNNCYSNETVILTPTMDSRLYMLSFLPFLVLLVLIRNLRILTIFSMLANISMLVSLV :.:::::..:::::::::::::::::::::::::::.::::: :.:::.::::.:::::: CCDS43 NGTTNNCHNNETVILTPTMDSRLYMLSFLPFLVLLVFIRNLRALSIFSLLANITMLVSLV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE6 IIIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSFESIGVVLPLENKMKNARHFPAILS .: :.:.:.:::::.::::: ::::::::::::::::.::.:::::::::. :.:: :: CCDS43 MIYQFIVQRIPDPSHLPLVAPWKTYPLFFGTAIFSFEGIGMVLPLENKMKDPRKFPLILY 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE6 LGMSIVTSLYIGMAALGYLRFGDDIKASISLNLPNCWLYQSVKLLYIAGILCTYALQFYV ::: ::: :::... ::::.:: .:..::.:::::::::::::::: ::. :::::::: CCDS43 LGMVIVTILYISLGCLGYLQFGANIQGSITLNLPNCWLYQSVKLLYSIGIFFTYALQFYV 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE6 PAEIIIPFAISRVSTRWALPLDLSIRLVMVCLTCLLAILIPRLDLVISLVGSVSGTALAL :::::::: .::. . : .:: .: :.:::::.:::::::::::::::::::..:::: CCDS43 PAEIIIPFFVSRAPEHCELVVDLFVRTVLVCLTCILAILIPRLDLVISLVGSVSSSALAL 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE6 IIPPLLEVTTFYSEGMSPLTIFKDALISILGFVGFVVGTYQALDELLKSEDSHPFSNSTT ::::::::::::::::::::::::::::::::::::::::.:: ::.. .. : ::: CCDS43 IIPPLLEVTTFYSEGMSPLTIFKDALISILGFVGFVVGTYEALYELIQPSNAPIFINSTC 420 430 440 450 460 470 pF1KE6 FVR CCDS43 AFI >>CCDS4314.1 SLC36A3 gene_id:285641|Hs108|chr5 (470 aa) initn: 1765 init1: 1765 opt: 1782 Z-score: 2168.7 bits: 410.7 E(32554): 1.8e-114 Smith-Waterman score: 1782; 60.0% identity (84.2% similar) in 448 aa overlap (40-479:20-466) 10 20 30 40 50 60 pF1KE6 PQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKKTK--------GITVFQALI .:::::.. .. :....:.:: CCDS43 MSLLGRDYNSELNSLDNGPQSPSESSSSITSENVHPAGEAGLSMMQTLI 10 20 30 40 70 80 90 100 110 120 pF1KE6 HLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRFCKRLNKPFM ::.: :.:::.::::::.::::.:.::.:::..: .. ::: ::..:::.. .::.: :. CCDS43 HLLKCNIGTGLLGLPLAIKNAGLLVGPVSLLAIGVLTVHCMVILLNCAQHLSQRLQKTFV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE6 DYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLGFCCVYIVFLADNLKQVVEAVN .::...:.:::. ::.::. :: :::. :::.:.::::::: ::..:.::::.:.:: .. CCDS43 NYGEATMYGLETCPNTWLRAHAVWGRYTVSFLLVITQLGFCSVYFMFMADNLQQMVEKAH 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE6 STTNNCYSNETVILTPTMDSRLYMLSFLPFLVLLVLIRNLRILTIFSMLANISMLVSLVI :.: : : . ::: .: :.::: .::::.:::.:.::..:..:: ::::. : :... CCDS43 VTSNICQPREILTLTPILDIRFYMLIILPFLILLVFIQNLKVLSVFSTLANITTLGSMAL 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE6 IIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSFESIGVVLPLENKMKNARHFPAILSL :..:: . :: :: :::.:.:::. ::::::::.::..:.::::.:.::. ..: .: : CCDS43 IFEYIMEGIPYPSNLPLMANWKTFLLFFGTAIFTFEGVGMVLPLKNQMKHPQQFSFVLYL 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE6 GMSIVTSLYIGMAALGYLRFGDDIKASISLNLPNCWLYQSVKLLYIAGILCTYALQFYVP ::::: ::: ...:::..::.: .:::.::::::::::::::.: ::. ::::::.:: CCDS43 GMSIVIILYILLGTLGYMKFGSDTQASITLNLPNCWLYQSVKLMYSIGIFFTYALQFHVP 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE6 AEIIIPFAISRVSTRWALPLDLSIRLVMVCLTCLLAILIPRLDLVISLVGSVSGTALALI ::::::::::.:: ::: .:::.: ..:::::. ::::::::::::::::::..::::: CCDS43 AEIIIPFAISQVSESWALFVDLSVRSALVCLTCVSAILIPRLDLVISLVGSVSSSALALI 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE6 IPPLLEVTTFYSEGMSPLTIFKDALISILGFVGFVVGTYQALDELLKSEDSHPFSNSTTF :: :::.. :::: :: .:: :: .:::.:..: . :::::: :: . :: ..::: CCDS43 IPALLEIVIFYSEDMSCVTIAKDIMISIVGLLGCIFGTYQALYEL-PQPISHSMANSTGV 410 420 430 440 450 460 pF1KE6 VR CCDS43 HA 470 >>CCDS83035.1 SLC36A1 gene_id:206358|Hs108|chr5 (386 aa) initn: 1757 init1: 1757 opt: 1764 Z-score: 2148.2 bits: 406.6 E(32554): 2.5e-113 Smith-Waterman score: 1764; 70.5% identity (88.7% similar) in 373 aa overlap (21-393:19-386) 10 20 30 40 50 60 pF1KE6 MSVTKSTEGPQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKKTKGITVFQAL .:: :: .. :. : ::. . .... : ::.: CCDS83 MSTQRLRNEDYHDYSSTDVSPEESPSEGLNNLS-----SPGSYQRFGQSNSTTWFQTL 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 IHLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRFCKRLNKPF :::.:::.:::.::::::::::::.:::.:::..:..: ::: ::::::..::.:::: : CCDS83 IHLLKGNIGTGLLGLPLAVKNAGIVMGPISLLIIGIVAVHCMGILVKCAHHFCRRLNKSF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 MDYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLGFCCVYIVFLADNLKQVVEAV .:::::::.:::..: .::.:::::::..:.::::.:::::::::.::::::.:::.::. CCDS83 VDYGDTVMYGLESSPCSWLRNHAHWGRRVVDFFLIVTQLGFCCVYFVFLADNFKQVIEAA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 NSTTNNCYSNETVILTPTMDSRLYMLSFLPFLVLLVLIRNLRILTIFSMLANISMLVSLV :.:::::..:::::::::::::::::::::::::::.::::: :.:::.::::.:::::: CCDS83 NGTTNNCHNNETVILTPTMDSRLYMLSFLPFLVLLVFIRNLRALSIFSLLANITMLVSLV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE6 IIIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSFESIGVVLPLENKMKNARHFPAILS .: :.:.:.:::::.::::: ::::::::::::::::.::.:::::::::. :.:: :: CCDS83 MIYQFIVQRIPDPSHLPLVAPWKTYPLFFGTAIFSFEGIGMVLPLENKMKDPRKFPLILY 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE6 LGMSIVTSLYIGMAALGYLRFGDDIKASISLNLPNCWLYQSVKLLYIAGILCTYALQFYV ::: ::: :::... ::::.:: .:..::.:::::::::::::::: ::. :::::::: CCDS83 LGMVIVTILYISLGCLGYLQFGANIQGSITLNLPNCWLYQSVKLLYSIGIFFTYALQFYV 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE6 PAEIIIPFAISRVSTRWALPLDLSIRLVMVCLTCLLAILIPRLDLVISLVGSVSGTALAL :::::::: .::. . : .:: .: :.:::: CCDS83 PAEIIIPFFVSRAPEHCELVVDLFVRTVLVCLT 360 370 380 430 440 450 460 470 480 pF1KE6 IIPPLLEVTTFYSEGMSPLTIFKDALISILGFVGFVVGTYQALDELLKSEDSHPFSNSTT >>CCDS8291.1 SLC36A4 gene_id:120103|Hs108|chr11 (504 aa) initn: 1559 init1: 598 opt: 1557 Z-score: 1894.4 bits: 360.0 E(32554): 3.4e-99 Smith-Waterman score: 1561; 50.9% identity (77.6% similar) in 477 aa overlap (2-467:4-476) 10 20 30 40 50 pF1KE6 MSVTKSTEGPQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKK------TK ..: .. : . .:.: : . .: :.: .: .: ..: . CCDS82 MEAAATPAAAGAARREELDMDVMRP---LINEQNFDGTSDEEHEQELLPVQKHYQLDDQE 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 GITVFQALIHLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRF ::. :.:.::.:::.:::.::::::.:::::..::.::. .:.:. :::::::.:.. . CCDS82 GISFVQTLMHLLKGNIGTGLLGLPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 CKRLNKPFMDYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLGFCCVYIVFLADN : :..: . :.::: ..:..: . ::..: ::: .:.:::.::::::: :::::::.: CCDS82 CLRFKKSTLGYSDTVSFAMEVSPWSCLQKQAAWGRSVVDFFLVITQLGFCSVYIVFLAEN 120 130 140 150 160 170 180 190 200 210 220 pF1KE6 LKQVVEAVNSTTNNCYSNETVILTP----TMDSRLYMLSFLPFLVLLVLIRNLRILTIFS .::: :. .. :: : .: ..: :.::: ::::..:::.::.:. : ..: CCDS82 VKQVHEGF-LESKVFISNSTNSSNPCERRSVDLRIYMLCFLPFIILLVFIRELKNLFVLS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 MLANISMLVSLVIIIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSFESIGVVLPLENK .:::.:: :::::: ::.....::: ::.::.:: ::::::::.:.::.:::::::::. CCDS82 FLANVSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQ 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 MKNARHFPAILSLGMSIVTSLYIGMAALGYLRFGDDIKASISLNLP-NCWLYQSVKLLYI ::....:: :..::.:::.::. .:.:::. : :.::.::.:::: . :::::::.:: CCDS82 MKESKRFPQALNIGMGIVTTLYVTLATLGYMCFHDEIKGSITLNLPQDVWLYQSVKILYS 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE6 AGILCTYALQFYVPAEIIIPFAISRVSTRWALPLDLSIRLVMVCLTCLLAILIPRLDLVI ::. ::..::::::::::: :. :.: ...:: .: .:: ::::::::.:: CCDS82 FGIFVTYSIQFYVPAEIIIPGITSKFHTKWKQICEFGIRSFLVSITCAGAILIPRLDIVI 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE6 SLVGSVSGTALALIIPPLLEVTTFYSEGMSPLTIFKDALISILGFVGFVVGTYQALDELL :.::.::...::::.:::.:. :: .: .. ..:. :.. : :::..::: ...:.. CCDS82 SFVGAVSSSTLALILPPLVEILTFSKEHYNIWMVLKNISIAFTGVVGFLLGTYITVEEII 420 430 440 450 460 470 470 480 pF1KE6 KSEDSHPFSNSTTFVR CCDS82 YPTPKVVAGTPQSPFLNLNSTCLTSGLK 480 490 500 >>CCDS47316.1 SLC36A3 gene_id:285641|Hs108|chr5 (511 aa) initn: 1356 init1: 1356 opt: 1370 Z-score: 1666.7 bits: 317.9 E(32554): 1.6e-86 Smith-Waterman score: 1691; 55.2% identity (77.3% similar) in 489 aa overlap (40-479:20-507) 10 20 30 40 50 60 pF1KE6 PQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKKTK--------GITVFQALI .:::::.. .. :....:.:: CCDS47 MSLLGRDYNSELNSLDNGPQSPSESSSSITSENVHPAGEAGLSMMQTLI 10 20 30 40 70 80 90 100 110 120 pF1KE6 HLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRFCKRLNKPFM ::.: :.:::.::::::.::::.:.::.:::..: .. ::: ::..:::.. .::.: :. CCDS47 HLLKCNIGTGLLGLPLAIKNAGLLVGPVSLLAIGVLTVHCMVILLNCAQHLSQRLQKTFV 50 60 70 80 90 100 130 140 pF1KE6 DYGDTVMHGLEANPNAWLQNHAHWGR---------------------HI----------- .::...:.:::. ::.::. :: ::: :. CCDS47 NYGEATMYGLETCPNTWLRAHAVWGRWNLALSPRLECSGKISAHCNPHLQGSSNSPAQAS 110 120 130 140 150 160 150 160 170 180 190 200 pF1KE6 ---------VSFFLIITQLGFCCVYIVFLADNLKQVVEAVNSTTNNCYSNETVILTPTMD :::.:.::::::: ::..:.::::.:.:: .. :.: : : . ::: .: CCDS47 RVAGIYRYTVSFLLVITQLGFCSVYFMFMADNLQQMVEKAHVTSNICQPREILTLTPILD 170 180 190 200 210 220 210 220 230 240 250 260 pF1KE6 SRLYMLSFLPFLVLLVLIRNLRILTIFSMLANISMLVSLVIIIQYITQEIPDPSRLPLVA :.::: .::::.:::.:.::..:..:: ::::. : :...:..:: . :: :: :::.: CCDS47 IRFYMLIILPFLILLVFIQNLKVLSVFSTLANITTLGSMALIFEYIMEGIPYPSNLPLMA 230 240 250 260 270 280 270 280 290 300 310 320 pF1KE6 SWKTYPLFFGTAIFSFESIGVVLPLENKMKNARHFPAILSLGMSIVTSLYIGMAALGYLR .:::. ::::::::.::..:.::::.:.::. ..: .: :::::: ::: ...:::.. CCDS47 NWKTFLLFFGTAIFTFEGVGMVLPLKNQMKHPQQFSFVLYLGMSIVIILYILLGTLGYMK 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE6 FGDDIKASISLNLPNCWLYQSVKLLYIAGILCTYALQFYVPAEIIIPFAISRVSTRWALP ::.: .:::.::::::::::::::.: ::. ::::::.::::::::::::.:: ::: CCDS47 FGSDTQASITLNLPNCWLYQSVKLMYSIGIFFTYALQFHVPAEIIIPFAISQVSESWALF 350 360 370 380 390 400 390 400 410 420 430 440 pF1KE6 LDLSIRLVMVCLTCLLAILIPRLDLVISLVGSVSGTALALIIPPLLEVTTFYSEGMSPLT .:::.: ..:::::. ::::::::::::::::::..::::::: :::.. :::: :: .: CCDS47 VDLSVRSALVCLTCVSAILIPRLDLVISLVGSVSSSALALIIPALLEIVIFYSEDMSCVT 410 420 430 440 450 460 450 460 470 480 pF1KE6 IFKDALISILGFVGFVVGTYQALDELLKSEDSHPFSNSTTFVR : :: .:::.:..: . :::::: :: . :: ..::: CCDS47 IAKDIMISIVGLLGCIFGTYQALYEL-PQPISHSMANSTGVHA 470 480 490 500 510 >>CCDS66202.1 SLC36A4 gene_id:120103|Hs108|chr11 (369 aa) initn: 1216 init1: 598 opt: 1223 Z-score: 1490.1 bits: 284.7 E(32554): 1.1e-76 Smith-Waterman score: 1223; 55.0% identity (81.0% similar) in 342 aa overlap (131-467:1-341) 110 120 130 140 150 160 pF1KE6 CMHILVKCAQRFCKRLNKPFMDYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLG .:..: . ::..: ::: .:.:::.::::: CCDS66 MEVSPWSCLQKQAAWGRSVVDFFLVITQLG 10 20 30 170 180 190 200 210 pF1KE6 FCCVYIVFLADNLKQVVEAVNSTTNNCYSNETVILTP----TMDSRLYMLSFLPFLVLLV :: :::::::.:.::: :. .. :: : .: ..: :.::: ::::..::: CCDS66 FCSVYIVFLAENVKQVHEGF-LESKVFISNSTNSSNPCERRSVDLRIYMLCFLPFIILLV 40 50 60 70 80 220 230 240 250 260 270 pF1KE6 LIRNLRILTIFSMLANISMLVSLVIIIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSF .::.:. : ..:.:::.:: :::::: ::.....::: ::.::.:: ::::::::.:.: CCDS66 FIRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAF 90 100 110 120 130 140 280 290 300 310 320 330 pF1KE6 ESIGVVLPLENKMKNARHFPAILSLGMSIVTSLYIGMAALGYLRFGDDIKASISLNLP-N :.:::::::::.::....:: :..::.:::.::. .:.:::. : :.::.::.:::: . CCDS66 EGIGVVLPLENQMKESKRFPQALNIGMGIVTTLYVTLATLGYMCFHDEIKGSITLNLPQD 150 160 170 180 190 200 340 350 360 370 380 390 pF1KE6 CWLYQSVKLLYIAGILCTYALQFYVPAEIIIPFAISRVSTRWALPLDLSIRLVMVCLTCL :::::::.:: ::. ::..::::::::::: :. :.: ...:: .: .:: CCDS66 VWLYQSVKILYSFGIFVTYSIQFYVPAEIIIPGITSKFHTKWKQICEFGIRSFLVSITCA 210 220 230 240 250 260 400 410 420 430 440 450 pF1KE6 LAILIPRLDLVISLVGSVSGTALALIIPPLLEVTTFYSEGMSPLTIFKDALISILGFVGF ::::::::.:::.::.::...::::.:::.:. :: .: .. ..:. :.. : ::: CCDS66 GAILIPRLDIVISFVGAVSSSTLALILPPLVEILTFSKEHYNIWMVLKNISIAFTGVVGF 270 280 290 300 310 320 460 470 480 pF1KE6 VVGTYQALDELLKSEDSHPFSNSTTFVR ..::: ...:.. CCDS66 LLGTYITVEEIIYPTPKVVAGTPQSPFLNLNSTCLTSGLK 330 340 350 360 >>CCDS78073.1 SLC36A1 gene_id:206358|Hs108|chr5 (243 aa) initn: 1123 init1: 1067 opt: 1074 Z-score: 1311.6 bits: 251.1 E(32554): 9.7e-67 Smith-Waterman score: 1074; 69.3% identity (89.9% similar) in 228 aa overlap (21-248:19-241) 10 20 30 40 50 60 pF1KE6 MSVTKSTEGPQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKKTKGITVFQAL .:: :: .. :. : ::. . .... : ::.: CCDS78 MSTQRLRNEDYHDYSSTDVSPEESPSEGLNNLS-----SPGSYQRFGQSNSTTWFQTL 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 IHLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRFCKRLNKPF :::.:::.:::.::::::::::::.:::.:::..:..: ::: ::::::..::.:::: : CCDS78 IHLLKGNIGTGLLGLPLAVKNAGIVMGPISLLIIGIVAVHCMGILVKCAHHFCRRLNKSF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 MDYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLGFCCVYIVFLADNLKQVVEAV .:::::::.:::..: .::.:::::::..:.::::.:::::::::.::::::.:::.::. CCDS78 VDYGDTVMYGLESSPCSWLRNHAHWGRRVVDFFLIVTQLGFCCVYFVFLADNFKQVIEAA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 NSTTNNCYSNETVILTPTMDSRLYMLSFLPFLVLLVLIRNLRILTIFSMLANISMLVSLV :.:::::..:::::::::::::::::::::::::::.::::: :.:::.::::.:::::: CCDS78 NGTTNNCHNNETVILTPTMDSRLYMLSFLPFLVLLVFIRNLRALSIFSLLANITMLVSLV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE6 IIIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSFESIGVVLPLENKMKNARHFPAILS .: :.:.: CCDS78 MIYQFIVQIL 240 483 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:41:29 2016 done: Tue Nov 8 13:41:29 2016 Total Scan time: 2.660 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]