FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6470, 504 aa 1>>>pF1KE6470 504 - 504 aa - 504 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4923+/-0.00113; mu= 16.6630+/- 0.067 mean_var=64.8407+/-13.442, 0's: 0 Z-trim(101.9): 35 B-trim: 0 in 0/48 Lambda= 0.159276 statistics sampled from 6682 (6711) to 6682 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.556), E-opt: 0.2 (0.206), width: 16 Scan time: 2.080 The best scores are: opt bits E(32554) CCDS8291.1 SLC36A4 gene_id:120103|Hs108|chr11 ( 504) 3285 764.2 0 CCDS66202.1 SLC36A4 gene_id:120103|Hs108|chr11 ( 369) 2399 560.6 1.1e-159 CCDS4316.1 SLC36A1 gene_id:206358|Hs108|chr5 ( 476) 1593 375.4 7.6e-104 CCDS4315.1 SLC36A2 gene_id:153201|Hs108|chr5 ( 483) 1542 363.7 2.6e-100 CCDS4314.1 SLC36A3 gene_id:285641|Hs108|chr5 ( 470) 1405 332.2 7.6e-91 CCDS83035.1 SLC36A1 gene_id:206358|Hs108|chr5 ( 386) 1335 316.1 4.4e-86 CCDS47316.1 SLC36A3 gene_id:285641|Hs108|chr5 ( 511) 1053 251.4 1.8e-66 CCDS78073.1 SLC36A1 gene_id:206358|Hs108|chr5 ( 243) 765 185.0 7.9e-47 >>CCDS8291.1 SLC36A4 gene_id:120103|Hs108|chr11 (504 aa) initn: 3285 init1: 3285 opt: 3285 Z-score: 4078.7 bits: 764.2 E(32554): 0 Smith-Waterman score: 3285; 99.4% identity (99.8% similar) in 504 aa overlap (1-504:1-504) 10 20 30 40 50 60 pF1KE6 MEAAATPAAAGAARREELDMDVMRPLINEQNFDGTSDEEHEQELLPVQKHYQLDDQEGIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MEAAATPAAAGAARREELDMDVMRPLINEQNFDGTSDEEHEQELLPVQKHYQLDDQEGIS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 FVQTLMHLLKGNIGTGLLGLPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFLCLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 FVQTLMHLLKGNIGTGLLGLPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFLCLR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 FKKSTLGYSDTVSFAMEVSPWSCLQKQAAWGRSVVDFFLVITQLGFCSVYIVFLAENVKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 FKKSTLGYSDTVSFAMEVSPWSCLQKQAAWGRSVVDFFLVITQLGFCSVYIVFLAENVKQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 VHEGFLESKVFISNSTNSSNPCERRSVDIRIYMLCFLPFIILLVFIRELKNLFVLSFLAN ::::::::::::::::::::::::::::.::::::::::::::::::::::::::::::: CCDS82 VHEGFLESKVFISNSTNSSNPCERRSVDLRIYMLCFLPFIILLVFIRELKNLFVLSFLAN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 VSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQMKES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 VSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQMKES 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 KRFPQALNIGMGIVTTLYVTLATLGYMCFHDEIKGSITLNLPQDVWLYQSVKILYSFGIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 KRFPQALNIGMGIVTTLYVTLATLGYMCFHDEIKGSITLNLPQDVWLYQSVKILYSFGIF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 VTYSIQFYVPAEIIIHGITSKFHTKWKQICEFGIRSFLVSITCAGAILIPRLDIVISFVG ::::::::::::::: :::::::::::::::::::::::::::::::::::::::::::: CCDS82 VTYSIQFYVPAEIIIPGITSKFHTKWKQICEFGIRSFLVSITCAGAILIPRLDIVISFVG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 AVSSSTLAIILPPLVEILTFSKEHYNIWMVLKNISIAFTGVVGFLLGTYITVEEIIYPTP ::::::::.::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 AVSSSTLALILPPLVEILTFSKEHYNIWMVLKNISIAFTGVVGFLLGTYITVEEIIYPTP 430 440 450 460 470 480 490 500 pF1KE6 KVVAGTPQSPFLNLNSTCLTSGLK :::::::::::::::::::::::: CCDS82 KVVAGTPQSPFLNLNSTCLTSGLK 490 500 >>CCDS66202.1 SLC36A4 gene_id:120103|Hs108|chr11 (369 aa) initn: 2399 init1: 2399 opt: 2399 Z-score: 2980.5 bits: 560.6 E(32554): 1.1e-159 Smith-Waterman score: 2399; 99.2% identity (99.7% similar) in 369 aa overlap (136-504:1-369) 110 120 130 140 150 160 pF1KE6 CMHILVRCSHFLCLRFKKSTLGYSDTVSFAMEVSPWSCLQKQAAWGRSVVDFFLVITQLG :::::::::::::::::::::::::::::: CCDS66 MEVSPWSCLQKQAAWGRSVVDFFLVITQLG 10 20 30 170 180 190 200 210 220 pF1KE6 FCSVYIVFLAENVKQVHEGFLESKVFISNSTNSSNPCERRSVDIRIYMLCFLPFIILLVF :::::::::::::::::::::::::::::::::::::::::::.:::::::::::::::: CCDS66 FCSVYIVFLAENVKQVHEGFLESKVFISNSTNSSNPCERRSVDLRIYMLCFLPFIILLVF 40 50 60 70 80 90 230 240 250 260 270 280 pF1KE6 IRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAFE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 IRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAFE 100 110 120 130 140 150 290 300 310 320 330 340 pF1KE6 GIGVVLPLENQMKESKRFPQALNIGMGIVTTLYVTLATLGYMCFHDEIKGSITLNLPQDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 GIGVVLPLENQMKESKRFPQALNIGMGIVTTLYVTLATLGYMCFHDEIKGSITLNLPQDV 160 170 180 190 200 210 350 360 370 380 390 400 pF1KE6 WLYQSVKILYSFGIFVTYSIQFYVPAEIIIHGITSKFHTKWKQICEFGIRSFLVSITCAG :::::::::::::::::::::::::::::: ::::::::::::::::::::::::::::: CCDS66 WLYQSVKILYSFGIFVTYSIQFYVPAEIIIPGITSKFHTKWKQICEFGIRSFLVSITCAG 220 230 240 250 260 270 410 420 430 440 450 460 pF1KE6 AILIPRLDIVISFVGAVSSSTLAIILPPLVEILTFSKEHYNIWMVLKNISIAFTGVVGFL :::::::::::::::::::::::.:::::::::::::::::::::::::::::::::::: CCDS66 AILIPRLDIVISFVGAVSSSTLALILPPLVEILTFSKEHYNIWMVLKNISIAFTGVVGFL 280 290 300 310 320 330 470 480 490 500 pF1KE6 LGTYITVEEIIYPTPKVVAGTPQSPFLNLNSTCLTSGLK ::::::::::::::::::::::::::::::::::::::: CCDS66 LGTYITVEEIIYPTPKVVAGTPQSPFLNLNSTCLTSGLK 340 350 360 >>CCDS4316.1 SLC36A1 gene_id:206358|Hs108|chr5 (476 aa) initn: 1579 init1: 602 opt: 1593 Z-score: 1977.9 bits: 375.4 E(32554): 7.6e-104 Smith-Waterman score: 1599; 55.0% identity (80.2% similar) in 449 aa overlap (51-498:38-473) 30 40 50 60 70 pF1KE6 DVMRPLINEQNFDGTSDEEHEQELLPVQKHYQ-LDDQEGISFVQTLMHLLKGNIGTGLLG :: . .... .. :::.::::::::::::: CCDS43 NEDYHDYSSTDVSPEESPSEGLNNLSSPGSYQRFGQSNSTTWFQTLIHLLKGNIGTGLLG 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE6 LPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFLCLRFKKSTLGYSDTVSFAMEVS ::::.::::::.:::::..:::..:::: :::.:.: .: :..:: . :.::: ...: : CCDS43 LPLAVKNAGIVMGPISLLIIGIVAVHCMGILVKCAHHFCRRLNKSFVDYGDTVMYGLESS 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE6 PWSCLQKQAAWGRSVVDFFLVITQLGFCSVYIVFLAENVKQVHEGFLESKVFISNSTNSS : : :...: ::: ::::::..:::::: ::.::::.: ::: :. .. .: :. CCDS43 PCSWLRNHAHWGRRVVDFFLIVTQLGFCCVYFVFLADNFKQVIEA---ANGTTNNCHNNE 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE6 NPCERRSVDIRIYMLCFLPFIILLVFIRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMP . ..: :.::: ::::..::::::.:. : ..:.:::..: ::::.:::..:. .: CCDS43 TVILTPTMDSRLYMLSFLPFLVLLVFIRNLRALSIFSLLANITMLVSLVMIYQFIVQRIP 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE6 DPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQMKESKRFPQALNIGMGIVTTLYV :: .::.:: :: ::::::::.:.:::::.::::::.::. ..:: : .:: ::: ::. CCDS43 DPSHLPLVAPWKTYPLFFGTAIFSFEGIGMVLPLENKMKDPRKFPLILYLGMVIVTILYI 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE6 TLATLGYMCFHDEIKGSITLNLPQDVWLYQSVKILYSFGIFVTYSIQFYVPAEIIIHGIT .:. :::. : .:.:::::::: . :::::::.:::.::: ::..:::::::::: .. CCDS43 SLGCLGYLQFGANIQGSITLNLP-NCWLYQSVKLLYSIGIFFTYALQFYVPAEIIIPFFV 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE6 SKFHTKWKQICEFGIRSFLVSITCAGAILIPRLDIVISFVGAVSSSTLAIILPPLVEILT :. . . . .. .:. :: .:: ::::::::.:::.::.::::.::.:.:::.:. : CCDS43 SRAPEHCELVVDLFVRTVLVCLTCILAILIPRLDLVISLVGSVSSSALALIIPPLLEVTT 370 380 390 400 410 420 440 450 460 470 480 490 pF1KE6 FSKEHYNIWMVLKNISIAFTGVVGFLLGTYITVEEIIYPTPKVVAGTPQSPFLNLNSTCL : .: .. ..:. :.. : :::..::: .. :.: :. ..:.. .:::: CCDS43 FYSEGMSPLTIFKDALISILGFVGFVVGTYEALYELIQPS--------NAPIF-INSTCA 430 440 450 460 470 500 pF1KE6 TSGLK CCDS43 FI >>CCDS4315.1 SLC36A2 gene_id:153201|Hs108|chr5 (483 aa) initn: 1544 init1: 598 opt: 1542 Z-score: 1914.4 bits: 363.7 E(32554): 2.6e-100 Smith-Waterman score: 1546; 50.5% identity (77.4% similar) in 477 aa overlap (4-476:2-467) 10 20 30 40 50 pF1KE6 MEAAATPAAAGAARREELDMDVMRPLINEQ---NFDGTSDEEHEQELLPVQKHYQLDDQE ..: .. : . .:.: : . . : :.: .: .: ..: . CCDS43 MSVTKSTEGPQGAVAIKLDLMSPPESAKKLENKDSTFLDESPSESAGLKK------TK 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 GISFVQTLMHLLKGNIGTGLLGLPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFL ::. :.:.::.:::.:::.::::::.:::::..::.::. .:.:. :::::::.:.. . CCDS43 GITVFQALIHLVKGNMGTGILGLPLAVKNAGILMGPLSLLVMGFIACHCMHILVKCAQRF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 CLRFKKSTLGYSDTVSFAMEVSPWSCLQKQAAWGRSVVDFFLVITQLGFCSVYIVFLAEN : :..: . :.::: ..:..: . ::..: ::: .:.:::.::::::: :::::::.: CCDS43 CKRLNKPFMDYGDTVMHGLEANPNAWLQNHAHWGRHIVSFFLIITQLGFCCVYIVFLADN 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 VKQVHEGF-LESKVFISNSTNSSNPCERRSVDIRIYMLCFLPFIILLVFIRELKNLFVLS .::: :. .. :: : .: ..: :.::: ::::..:::.::.:. : ..: CCDS43 LKQVVEAVNSTTNNCYSNETVILTP----TMDSRLYMLSFLPFLVLLVLIRNLRILTIFS 180 190 200 210 220 240 250 260 270 280 290 pF1KE6 FLANVSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQ .:::.:: :::::: ::.....::: ::.::.:: ::::::::.:.::.:::::::::. CCDS43 MLANISMLVSLVIIIQYITQEIPDPSRLPLVASWKTYPLFFGTAIFSFESIGVVLPLENK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE6 MKESKRFPQALNIGMGIVTTLYVTLATLGYMCFHDEIKGSITLNLPQDVWLYQSVKILYS ::....:: :..::.:::.::. .:.:::. : :.::.::.:::: . :::::::.:: CCDS43 MKNARHFPAILSLGMSIVTSLYIGMAALGYLRFGDDIKASISLNLP-NCWLYQSVKLLYI 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 FGIFVTYSIQFYVPAEIIIHGITSKFHTKWKQICEFGIRSFLVSITCAGAILIPRLDIVI ::. ::..:::::::::: :. :.: ...:: .: .:: ::::::::.:: CCDS43 AGILCTYALQFYVPAEIIIPFAISRVSTRWALPLDLSIRLVMVCLTCLLAILIPRLDLVI 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE6 SFVGAVSSSTLAIILPPLVEILTFSKEHYNIWMVLKNISIAFTGVVGFLLGTYITVEEII :.::.::...::.:.:::.:. :: .: .. ..:. :.. : :::..::: ...:.. CCDS43 SLVGSVSGTALALIIPPLLEVTTFYSEGMSPLTIFKDALISILGFVGFVVGTYQALDELL 410 420 430 440 450 460 480 490 500 pF1KE6 YPTPKVVAGTPQSPFLNLNSTCLTSGLK CCDS43 KSEDSHPFSNSTTFVR 470 480 >>CCDS4314.1 SLC36A3 gene_id:285641|Hs108|chr5 (470 aa) initn: 1434 init1: 509 opt: 1405 Z-score: 1744.5 bits: 332.2 E(32554): 7.6e-91 Smith-Waterman score: 1405; 49.5% identity (79.5% similar) in 438 aa overlap (56-486:39-465) 30 40 50 60 70 80 pF1KE6 LINEQNFDGTSDEEHEQELLPVQKHYQLDDQEGISFVQTLMHLLKGNIGTGLLGLPLAIK . :.:..:::.:::: :::::::::::::: CCDS43 NSELNSLDNGPQSPSESSSSITSENVHPAGEAGLSMMQTLIHLLKCNIGTGLLGLPLAIK 10 20 30 40 50 60 90 100 110 120 130 140 pF1KE6 NAGIVLGPISLVFIGIISVHCMHILVRCSHFLCLRFKKSTLGYSDTVSFAMEVSPWSCLQ :::...::.::. ::...:::: ::. :.. : :..:. ..:.... ...:. : . :. CCDS43 NAGLLVGPVSLLAIGVLTVHCMVILLNCAQHLSQRLQKTFVNYGEATMYGLETCPNTWLR 70 80 90 100 110 120 150 160 170 180 190 200 pF1KE6 KQAAWGRSVVDFFLVITQLGFCSVYIVFLAENVKQVHEGFLESKVFISNSTNSSNPCERR .:.::: .:.:.::::::::::::..:.:.:..:. : :. .. :: :. : CCDS43 AHAVWGRYTVSFLLVITQLGFCSVYFMFMADNLQQMVE-----KAHVT-----SNICQPR 130 140 150 160 170 210 220 230 240 250 pF1KE6 SV-------DIRIYMLCFLPFIILLVFIRELKNLFVLSFLANVSMAVSLVIIYQYVVRNM . :::.::: .:::.::::::..:: : :.: :::.. :...:..:..... CCDS43 EILTLTPILDIRFYMLIILPFLILLVFIQNLKVLSVFSTLANITTLGSMALIFEYIMEGI 180 190 200 210 220 230 260 270 280 290 300 310 pF1KE6 PDPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQMKESKRFPQALNIGMGIVTTLY : : :::..:.:: . ::::::.:.:::.:.::::.::::. ..: .: .::.:: :: CCDS43 PYPSNLPLMANWKTFLLFFGTAIFTFEGVGMVLPLKNQMKHPQQFSFVLYLGMSIVIILY 240 250 260 270 280 290 320 330 340 350 360 370 pF1KE6 VTLATLGYMCFHDEIKGSITLNLPQDVWLYQSVKILYSFGIFVTYSIQFYVPAEIIIHGI . :.::::: : .. ..::::::: . :::::::..::.::: ::..::.::::::: CCDS43 ILLGTLGYMKFGSDTQASITLNLP-NCWLYQSVKLMYSIGIFFTYALQFHVPAEIIIPFA 300 310 320 330 340 350 380 390 400 410 420 430 pF1KE6 TSKFHTKWKQICEFGIRSFLVSITCAGAILIPRLDIVISFVGAVSSSTLAIILPPLVEIL :. .: . ....:: :: .::..::::::::.:::.::.::::.::.:.: :.::. CCDS43 ISQVSESWALFVDLSVRSALVCLTCVSAILIPRLDLVISLVGSVSSSALALIIPALLEIV 360 370 380 390 400 410 440 450 460 470 480 490 pF1KE6 TFSKEHYNIWMVLKNISIAFTGVVGFLLGTYITVEEIIYPTPKVVAGTPQSPFLNLNSTC : .: .. . :.: :...:..: ..::: .. :. : . .:.. CCDS43 IFYSEDMSCVTIAKDIMISIVGLLGCIFGTYQALYELPQPISHSMANSTGVHA 420 430 440 450 460 470 500 pF1KE6 LTSGLK >>CCDS83035.1 SLC36A1 gene_id:206358|Hs108|chr5 (386 aa) initn: 1339 init1: 602 opt: 1335 Z-score: 1658.9 bits: 316.1 E(32554): 4.4e-86 Smith-Waterman score: 1335; 57.2% identity (81.6% similar) in 353 aa overlap (51-402:38-386) 30 40 50 60 70 pF1KE6 DVMRPLINEQNFDGTSDEEHEQELLPVQKHYQ-LDDQEGISFVQTLMHLLKGNIGTGLLG :: . .... .. :::.::::::::::::: CCDS83 NEDYHDYSSTDVSPEESPSEGLNNLSSPGSYQRFGQSNSTTWFQTLIHLLKGNIGTGLLG 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE6 LPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFLCLRFKKSTLGYSDTVSFAMEVS ::::.::::::.:::::..:::..:::: :::.:.: .: :..:: . :.::: ...: : CCDS83 LPLAVKNAGIVMGPISLLIIGIVAVHCMGILVKCAHHFCRRLNKSFVDYGDTVMYGLESS 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE6 PWSCLQKQAAWGRSVVDFFLVITQLGFCSVYIVFLAENVKQVHEGFLESKVFISNSTNSS : : :...: ::: ::::::..:::::: ::.::::.: ::: :. .. .: :. CCDS83 PCSWLRNHAHWGRRVVDFFLIVTQLGFCCVYFVFLADNFKQVIEA---ANGTTNNCHNNE 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE6 NPCERRSVDIRIYMLCFLPFIILLVFIRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMP . ..: :.::: ::::..::::::.:. : ..:.:::..: ::::.:::..:. .: CCDS83 TVILTPTMDSRLYMLSFLPFLVLLVFIRNLRALSIFSLLANITMLVSLVMIYQFIVQRIP 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE6 DPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQMKESKRFPQALNIGMGIVTTLYV :: .::.:: :: ::::::::.:.:::::.::::::.::. ..:: : .:: ::: ::. CCDS83 DPSHLPLVAPWKTYPLFFGTAIFSFEGIGMVLPLENKMKDPRKFPLILYLGMVIVTILYI 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE6 TLATLGYMCFHDEIKGSITLNLPQDVWLYQSVKILYSFGIFVTYSIQFYVPAEIIIHGIT .:. :::. : .:.:::::::: . :::::::.:::.::: ::..:::::::::: .. CCDS83 SLGCLGYLQFGANIQGSITLNLP-NCWLYQSVKLLYSIGIFFTYALQFYVPAEIIIPFFV 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE6 SKFHTKWKQICEFGIRSFLVSITCAGAILIPRLDIVISFVGAVSSSTLAIILPPLVEILT :. . . . .. .:. :: .: CCDS83 SRAPEHCELVVDLFVRTVLVCLT 370 380 >>CCDS47316.1 SLC36A3 gene_id:285641|Hs108|chr5 (511 aa) initn: 1281 init1: 509 opt: 1053 Z-score: 1306.8 bits: 251.4 E(32554): 1.8e-66 Smith-Waterman score: 1313; 45.3% identity (72.7% similar) in 479 aa overlap (56-486:39-506) 30 40 50 60 70 80 pF1KE6 LINEQNFDGTSDEEHEQELLPVQKHYQLDDQEGISFVQTLMHLLKGNIGTGLLGLPLAIK . :.:..:::.:::: :::::::::::::: CCDS47 NSELNSLDNGPQSPSESSSSITSENVHPAGEAGLSMMQTLIHLLKCNIGTGLLGLPLAIK 10 20 30 40 50 60 90 100 110 120 130 140 pF1KE6 NAGIVLGPISLVFIGIISVHCMHILVRCSHFLCLRFKKSTLGYSDTVSFAMEVSPWSCLQ :::...::.::. ::...:::: ::. :.. : :..:. ..:.... ...:. : . :. CCDS47 NAGLLVGPVSLLAIGVLTVHCMVILLNCAQHLSQRLQKTFVNYGEATMYGLETCPNTWLR 70 80 90 100 110 120 150 160 pF1KE6 KQAAWGR-----------------------------------------SVVDFFLVITQL .:.::: .:.:.:::::: CCDS47 AHAVWGRWNLALSPRLECSGKISAHCNPHLQGSSNSPAQASRVAGIYRYTVSFLLVITQL 130 140 150 160 170 180 170 180 190 200 210 pF1KE6 GFCSVYIVFLAENVKQVHEGFLESKVFISNSTNSSNPCERRSV-------DIRIYMLCFL ::::::..:.:.:..:. : :. .. :: :. : . :::.::: .: CCDS47 GFCSVYFMFMADNLQQMVE-----KAHVT-----SNICQPREILTLTPILDIRFYMLIIL 190 200 210 220 230 220 230 240 250 260 270 pF1KE6 PFIILLVFIRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFF ::.::::::..:: : :.: :::.. :...:..:.....: : :::..:.:: . ::: CCDS47 PFLILLVFIQNLKVLSVFSTLANITTLGSMALIFEYIMEGIPYPSNLPLMANWKTFLLFF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE6 GTAVFAFEGIGVVLPLENQMKESKRFPQALNIGMGIVTTLYVTLATLGYMCFHDEIKGSI :::.:.:::.:.::::.::::. ..: .: .::.:: ::. :.::::: : .. ..:: CCDS47 GTAIFTFEGVGMVLPLKNQMKHPQQFSFVLYLGMSIVIILYILLGTLGYMKFGSDTQASI 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE6 TLNLPQDVWLYQSVKILYSFGIFVTYSIQFYVPAEIIIHGITSKFHTKWKQICEFGIRSF ::::: . :::::::..::.::: ::..::.::::::: :. .: . ....:: CCDS47 TLNLP-NCWLYQSVKLMYSIGIFFTYALQFHVPAEIIIPFAISQVSESWALFVDLSVRSA 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE6 LVSITCAGAILIPRLDIVISFVGAVSSSTLAIILPPLVEILTFSKEHYNIWMVLKNISIA :: .::..::::::::.:::.::.::::.::.:.: :.::. : .: .. . :.: :. CCDS47 LVCLTCVSAILIPRLDLVISLVGSVSSSALALIIPALLEIVIFYSEDMSCVTIAKDIMIS 420 430 440 450 460 470 460 470 480 490 500 pF1KE6 FTGVVGFLLGTYITVEEIIYPTPKVVAGTPQSPFLNLNSTCLTSGLK ..:..: ..::: .. :. : . .:.. CCDS47 IVGLLGCIFGTYQALYELPQPISHSMANSTGVHA 480 490 500 510 >>CCDS78073.1 SLC36A1 gene_id:206358|Hs108|chr5 (243 aa) initn: 791 init1: 574 opt: 765 Z-score: 954.2 bits: 185.0 E(32554): 7.9e-47 Smith-Waterman score: 765; 56.5% identity (82.1% similar) in 207 aa overlap (51-256:38-241) 30 40 50 60 70 pF1KE6 DVMRPLINEQNFDGTSDEEHEQELLPVQKHYQ-LDDQEGISFVQTLMHLLKGNIGTGLLG :: . .... .. :::.::::::::::::: CCDS78 NEDYHDYSSTDVSPEESPSEGLNNLSSPGSYQRFGQSNSTTWFQTLIHLLKGNIGTGLLG 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE6 LPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFLCLRFKKSTLGYSDTVSFAMEVS ::::.::::::.:::::..:::..:::: :::.:.: .: :..:: . :.::: ...: : CCDS78 LPLAVKNAGIVMGPISLLIIGIVAVHCMGILVKCAHHFCRRLNKSFVDYGDTVMYGLESS 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE6 PWSCLQKQAAWGRSVVDFFLVITQLGFCSVYIVFLAENVKQVHEGFLESKVFISNSTNSS : : :...: ::: ::::::..:::::: ::.::::.: ::: :. .. .: :. CCDS78 PCSWLRNHAHWGRRVVDFFLIVTQLGFCCVYFVFLADNFKQVIEA---ANGTTNNCHNNE 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE6 NPCERRSVDIRIYMLCFLPFIILLVFIRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMP . ..: :.::: ::::..::::::.:. : ..:.:::..: ::::.:::..:. CCDS78 TVILTPTMDSRLYMLSFLPFLVLLVFIRNLRALSIFSLLANITMLVSLVMIYQFIVQIL 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE6 DPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQMKESKRFPQALNIGMGIVTTLYV 504 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:36:47 2016 done: Tue Nov 8 13:36:48 2016 Total Scan time: 2.080 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]