FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2606, 706 aa 1>>>pF1KE2606 706 - 706 aa - 706 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4329+/-0.00108; mu= 19.0794+/- 0.065 mean_var=69.6848+/-13.873, 0's: 0 Z-trim(103.3): 28 B-trim: 50 in 1/49 Lambda= 0.153640 statistics sampled from 7336 (7356) to 7336 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.57), E-opt: 0.2 (0.226), width: 16 Scan time: 2.500 The best scores are: opt bits E(32554) CCDS12245.1 SLC44A2 gene_id:57153|Hs108|chr19 ( 706) 4778 1068.9 0 CCDS54216.1 SLC44A2 gene_id:57153|Hs108|chr19 ( 704) 4702 1052.0 0 CCDS44164.1 SLC44A5 gene_id:204962|Hs108|chr1 ( 717) 2889 650.1 3.2e-186 CCDS667.1 SLC44A5 gene_id:204962|Hs108|chr1 ( 719) 2880 648.2 1.3e-185 CCDS4724.2 SLC44A4 gene_id:80736|Hs108|chr6 ( 710) 2350 530.7 2.9e-150 CCDS54989.1 SLC44A4 gene_id:80736|Hs108|chr6 ( 634) 2023 458.2 1.7e-128 CCDS54990.1 SLC44A4 gene_id:80736|Hs108|chr6 ( 668) 1937 439.1 1e-122 CCDS75868.1 SLC44A1 gene_id:23446|Hs108|chr9 ( 652) 689 162.5 1.8e-39 CCDS83390.1 SLC44A1 gene_id:23446|Hs108|chr9 ( 654) 689 162.5 1.8e-39 CCDS6763.1 SLC44A1 gene_id:23446|Hs108|chr9 ( 657) 689 162.5 1.9e-39 CCDS58011.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 620) 624 148.1 3.8e-35 CCDS72827.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 573) 615 146.0 1.4e-34 CCDS58012.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 585) 615 146.1 1.5e-34 CCDS751.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 605) 615 146.1 1.5e-34 CCDS58013.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 617) 615 146.1 1.5e-34 CCDS44176.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 653) 615 146.1 1.6e-34 >>CCDS12245.1 SLC44A2 gene_id:57153|Hs108|chr19 (706 aa) initn: 4778 init1: 4778 opt: 4778 Z-score: 5719.8 bits: 1068.9 E(32554): 0 Smith-Waterman score: 4778; 99.9% identity (100.0% similar) in 706 aa overlap (1-706:1-706) 10 20 30 40 50 60 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEKCPDRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEKCPDRY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLARRCFPAIHAYK :::::::::::::::::::::::::::::::::.:::::::::::::::::::::::::: CCDS12 LTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLQDGDCPAVLIPSKPLARRCFPAIHAYK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 GVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTVSWYWIIIGLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTVSWYWIIIGLV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 IAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEAGSDVSLVDLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 IAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEAGSDVSLVDLG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 FQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEASRAVGYVMCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEASRAVGYVMCS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 LLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFTAKTCNPETFPSSNESR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFTAKTCNPETFPSSNESR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 QCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLAGAFASYYWALR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLAGAFASYYWALR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 KPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRLKAAENKFAKCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRLKAAENKFAKCL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 MTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNIIRVAVLDKVTDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNIIRVAVLDKVTDF 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 LFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGSYLIAHGFFSVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGSYLIAHGFFSVY 610 620 630 640 650 660 670 680 690 700 pF1KE2 GMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES :::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES 670 680 690 700 >>CCDS54216.1 SLC44A2 gene_id:57153|Hs108|chr19 (704 aa) initn: 4691 init1: 4691 opt: 4702 Z-score: 5628.7 bits: 1052.0 E(32554): 0 Smith-Waterman score: 4702; 98.9% identity (99.3% similar) in 706 aa overlap (1-706:1-704) 10 20 30 40 50 60 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP : ::: . : .:::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MEDERKN--GAYGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEKCPDRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 RKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEKCPDRY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 LTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLARRCFPAIHAYK :::::::::::::::::::::::::::::::::.:::::::::::::::::::::::::: CCDS54 LTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLQDGDCPAVLIPSKPLARRCFPAIHAYK 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 GVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTVSWYWIIIGLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTVSWYWIIIGLV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 IAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEAGSDVSLVDLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEAGSDVSLVDLG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE2 FQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEASRAVGYVMCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 FQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEASRAVGYVMCS 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE2 LLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFTAKTCNPETFPSSNESR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFTAKTCNPETFPSSNESR 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE2 QCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLAGAFASYYWALR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLAGAFASYYWALR 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE2 KPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRLKAAENKFAKCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRLKAAENKFAKCL 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE2 MTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNIIRVAVLDKVTDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNIIRVAVLDKVTDF 540 550 560 570 580 590 610 620 630 640 650 660 pF1KE2 LFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGSYLIAHGFFSVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGSYLIAHGFFSVY 600 610 620 630 640 650 670 680 690 700 pF1KE2 GMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES :::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES 660 670 680 690 700 >>CCDS44164.1 SLC44A5 gene_id:204962|Hs108|chr1 (717 aa) initn: 2902 init1: 1389 opt: 2889 Z-score: 3456.8 bits: 650.1 E(32554): 3.2e-186 Smith-Waterman score: 2889; 54.9% identity (83.8% similar) in 705 aa overlap (4-702:9-713) 10 20 30 40 50 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAW . : : :. ::: ::::. ::.:::..::...:: :.::...:..:: CCDS44 MNDTEKPADTPSEEEDFGDPRTYDPDFKGPVANRSCTDVLCCMIFLLCIIGYIVLGLVAW 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 THGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEK .:::::.. :::::.:.::::::: :::: :::::...:.:: :::..:::: :::: : CCDS44 VHGDPRRAAYPTDSQGHFCGQKGTPNENKTILFYFNLLRCTSPSVLLNLQCPTTQICVSK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 CPDRYLTYLNAR--SSRD---FEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLAR ::...:::.. . ..: .: :.::: : :.....: : :::....::::. . CCDS44 CPEKFLTYVEMQLLYTKDKSYWEDYRQFCKTTAKPVKSLTQLLLDDDCPTAIFPSKPFLQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 RCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTV :::: . . .:.: .:.. ..::.:. .....: .:. : .:.:..:....::::. CCDS44 RCFPDFSTKNGTLTIGSKMMFQDGNGGTRSVVELGIAANGINKLLDAKSLGLKVFEDYAR 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE2 SWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEA .::::.:::.:::..: .:.:::::.:: . ::..: :: ..::::.:::..:. :. . CCDS44 TWYWILIGLTIAMVLSWIFLILLRFIAGCLFWVFMIGVIGIIGYGIWHCYQQYTNLQERP 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE2 GSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEA .: ... :.:.::.. .:..:.:::..::::: :.:::.::.:::::.:: .:: :.::. CCDS44 SSVLTIYDIGIQTNISMYFELQQTWFTFMIILCIIEVIVILMLIFLRNRIRVAIILLKEG 310 320 330 340 350 360 360 370 380 390 400 pF1KE2 SRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIF-DDSPCPFTAKTCN :.:.::: .:.:: .::.:: .:: ::. :::::.::. :::.. . : .::. CCDS44 SKAIGYVPSTLVYPALTFILLSICICYWVVTAVFLATSGVPVYKVIAPGGHCIHENQTCD 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE2 PETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLA :: : ... .. ::.: :.::::::.: ::. . ....: :.:.:: :::.:::: .:: CCDS44 PEIFNTTEIAKACPGALCNFAFYGGKSLYHQYIPTFHVYNLFVFLWLINFVIALGQCALA 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE2 GAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRL ::::.::::..::::.: .:::.:::::.::::::::::.::.:..:.....:::::.:: CCDS44 GAFATYYWAMKKPDDIPRYPLFTAFGRAIRYHTGSLAFGSLIIALIQMFKIVLEYLDHRL 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE2 KAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNII : ..: ..: :. ::.:::::::. :::::::::::::::: ::: ::..:: :::::.. CCDS44 KRTQNTLSKFLQCCLRCCFWCLENAIKFLNRNAYIMIAIYGRNFCRSAKDAFNLLMRNVL 550 560 570 580 590 600 590 600 610 620 630 640 pF1KE2 RVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGS .::: :.:: :...:::::..::.:.:::.:::.:. .. . :::::::.:::: :: CCDS44 KVAVTDEVTYFVLFLGKLLVAGSIGVLAFLFFTQRLPVIAQGPASLNYYWVPLLTVIFGS 610 620 630 640 650 660 650 660 670 680 690 700 pF1KE2 YLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES :::::::::::.:::.:.:.::::::::::::. :::..:. : :.... : . CCDS44 YLIAHGFFSVYAMCVETIFICFLEDLERNDGSTARPYYVSQPLLKIFQEENPQTRKQ 670 680 690 700 710 >>CCDS667.1 SLC44A5 gene_id:204962|Hs108|chr1 (719 aa) initn: 2893 init1: 1380 opt: 2880 Z-score: 3446.0 bits: 648.2 E(32554): 1.3e-185 Smith-Waterman score: 2880; 55.1% identity (83.9% similar) in 701 aa overlap (4-698:9-709) 10 20 30 40 50 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAW . : : :. ::: ::::. ::.:::..::...:: :.::...:..:: CCDS66 MNDTEKPADTPSEEEDFGDPRTYDPDFKGPVANRSCTDVLCCMIFLLCIIGYIVLGLVAW 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 THGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEK .:::::.. :::::.:.::::::: :::: :::::...:.:: :::..:::: :::: : CCDS66 VHGDPRRAAYPTDSQGHFCGQKGTPNENKTILFYFNLLRCTSPSVLLNLQCPTTQICVSK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 CPDRYLTYLNAR--SSRD---FEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLAR ::...:::.. . ..: .: :.::: : :.....: : :::....::::. . CCDS66 CPEKFLTYVEMQLLYTKDKSYWEDYRQFCKTTAKPVKSLTQLLLDDDCPTAIFPSKPFLQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 RCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTV :::: . . .:.: .:.. ..::.:. .....: .:. : .:.:..:....::::. CCDS66 RCFPDFSTKNGTLTIGSKMMFQDGNGGTRSVVELGIAANGINKLLDAKSLGLKVFEDYAR 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE2 SWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEA .::::.:::.:::..: .:.:::::.:: . ::..: :: ..::::.:::..:. :. . CCDS66 TWYWILIGLTIAMVLSWIFLILLRFIAGCLFWVFMIGVIGIIGYGIWHCYQQYTNLQERP 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE2 GSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEA .: ... :.:.::.. .:..:.:::..::::: :.:::.::.:::::.:: .:: :.::. CCDS66 SSVLTIYDIGIQTNISMYFELQQTWFTFMIILCIIEVIVILMLIFLRNRIRVAIILLKEG 310 320 330 340 350 360 360 370 380 390 400 pF1KE2 SRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIF-DDSPCPFTAKTCN :.:.::: .:.:: .::.:: .:: ::. :::::.::. :::.. . : .::. CCDS66 SKAIGYVPSTLVYPALTFILLSICICYWVVTAVFLATSGVPVYKVIAPGGHCIHENQTCD 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE2 PETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLA :: : ... .. ::.: :.::::::.: ::. . ....: :.:.:: :::.:::: .:: CCDS66 PEIFNTTEIAKACPGALCNFAFYGGKSLYHQYIPTFHVYNLFVFLWLINFVIALGQCALA 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE2 GAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRL ::::.::::..::::.: .:::.:::::.::::::::::.::.:..:.....:::::.:: CCDS66 GAFATYYWAMKKPDDIPRYPLFTAFGRAIRYHTGSLAFGSLIIALIQMFKIVLEYLDHRL 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE2 KAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNII : ..: ..: :. ::.:::::::. :::::::::::::::: ::: ::..:: :::::.. CCDS66 KRTQNTLSKFLQCCLRCCFWCLENAIKFLNRNAYIMIAIYGRNFCRSAKDAFNLLMRNVL 550 560 570 580 590 600 590 600 610 620 630 640 pF1KE2 RVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGS .::: :.:: :...:::::..::.:.:::.:::.:. .. . :::::::.:::: :: CCDS66 KVAVTDEVTYFVLFLGKLLVAGSIGVLAFLFFTQRLPVIAQGPASLNYYWVPLLTVIFGS 610 620 630 640 650 660 650 660 670 680 690 700 pF1KE2 YLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES :::::::::::.:::.:.:.:: :::::::::.:.:::.. .:. .: : CCDS66 YLIAHGFFSVYAMCVETIFICFCEDLERNDGSTEKPYFVTPNLHGILIKKQLVPQKQKE 670 680 690 700 710 >>CCDS4724.2 SLC44A4 gene_id:80736|Hs108|chr6 (710 aa) initn: 2047 init1: 1178 opt: 2350 Z-score: 2811.1 bits: 530.7 E(32554): 2.9e-150 Smith-Waterman score: 2500; 53.3% identity (79.0% similar) in 719 aa overlap (3-701:7-700) 10 20 30 40 50 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWT :: . ::: : ::::.:.::: ::.:::.::::..:: :.::..:::.:: CCDS47 MGGKQRDEDDEAYGK---PVKYDPSFRGPIKNRSCTDVICCVLFLLFILGYIVVGIVAWL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 HGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKC--ASPLVLLE---FQCPTPQI .::::.:.:: .: : .::. : .:..::::.:::: .: .: .. . .::::::. CCDS47 YGDPRQVLYPRNSTGAYCGM-G-ENKDKPYLLYFNIFSCILSSNIISVAENGLQCPTPQV 60 70 80 90 100 110 120 130 140 150 160 pF1KE2 CVEKCP-DRYLTYLNARSSRDFEYY----KQFCVPGFKNNKGVAEVLRDGDCPAVLIPSK :: .:: : . . : :. : . ..::.:: : : :.. ::. :.:: CCDS47 CVSSCPEDPWTVGKNEFSQTVGEVFYTKNRNFCLPGVPWNMTVITSLQQELCPSFLLPSA 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 PLARRCFPAIHAYKGVLM-VGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIF : :::: .. .: . :.:: ..: :. :... :.::.....:: CCDS47 PALGRCFPWTNVTPPALPGITNDTTIQQG------ISGLIDS-------LNARDISVKIF 180 190 200 210 220 230 240 250 260 270 280 pF1KE2 EDYTVSWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSR ::.. :::::...: .:...:::::.:::..:: .: :.:. :. ::.:::..:. :: CCDS47 EDFAQSWYWILVALGVALVLSLLFILLLRLVAGPLVLVLILGVLGVLAYGIYYCWEEYRV 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE2 LRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIA :: . :...: .::: :.. .: ...:::: .:.:..::.:..:.:::::.:: :::: CCDS47 LR-DKGASIS--QLGFTTNLSAYQSVQETWLAALIVLAVLEAILLLMLIFLRQRIRIAIA 290 300 310 320 330 350 360 370 380 390 400 pF1KE2 LIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDD---SP-C :.::::.::: .: ...:::::: :: .:::::: ::..:.::.. : .. . :: : CCDS47 LLKEASKAVGQMMSTMFYPLVTFVLLLICIAYWAMTALYLATSGQPQYVLWASNISSPGC 340 350 360 370 380 390 410 420 430 440 450 pF1KE2 ---PFTAKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLAN :... .::: : : : ::. : : :.... .:....:::.... .:: : CCDS47 EKVPINT-SCNP-TAHLVNSS--CPGLMCVFQGYSSKGLIQRSVFNLQIYGVLGLFWTLN 400 410 420 430 440 450 460 470 480 490 500 510 pF1KE2 FVLALGQVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQII .:::::: .:::::::.:::..::.:.:.:::.::: :.:::::::::::::::..::: CCDS47 WVLALGQCVLAGAFASFYWAFHKPQDIPTFPLISAFIRTLRYHTGSLAFGALILTLVQIA 460 470 480 490 500 510 520 530 540 550 560 570 pF1KE2 RVILEYLDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSAR ::::::.:..:....: :.:.: :.:::.:::::::::::::::::::::: :::.::. CCDS47 RVILEYIDHKLRGVQNPVARCIMCCFKCCLWCLEKFIKFLNRNAYIMIAIYGKNFCVSAK 520 530 540 550 560 570 580 590 600 610 620 630 pF1KE2 NAFFLLMRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIR-IVQD-TAPPLN :::.::::::.::.:::::::.:...::::.::.::.:.::::. :: . .: .: :: CCDS47 NAFMLLMRNIVRVVVLDKVTDLLLFFGKLLVVGGVGVLSFFFFSGRIPGLGKDFKSPHLN 580 590 600 610 620 630 640 650 660 670 680 690 pF1KE2 YYWVPILTVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLL :::.::.: :.:.:.:: :::::.::::::::::::::::::.:: .:::.::..: :.: CCDS47 YYWLPIMTSILGAYVIASGFFSVFGMCVDTLFLCFLEDLERNNGSLDRPYYMSKSLLKIL 640 650 660 670 680 690 700 pF1KE2 NKTNKKAAES .: :. CCDS47 GKKNEAPPDNKKRKK 700 710 >>CCDS54989.1 SLC44A4 gene_id:80736|Hs108|chr6 (634 aa) initn: 1787 init1: 1178 opt: 2023 Z-score: 2420.2 bits: 458.2 E(32554): 1.7e-128 Smith-Waterman score: 2173; 52.6% identity (78.8% similar) in 642 aa overlap (80-701:3-624) 50 60 70 80 90 100 pF1KE2 VGIIAWTHGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKC--ASPLVLLE---F .:..::::.:::: .: .: .. . . CCDS54 MGENKDKPYLLYFNIFSCILSSNIISVAENGL 10 20 30 110 120 130 140 150 pF1KE2 QCPTPQICVEKCP-DRYLTYLNARSSRDFEYY----KQFCVPGFKNNKGVAEVLRDGDCP ::::::.:: .:: : . . : :. : . ..::.:: : : :.. :: CCDS54 QCPTPQVCVSSCPEDPWTVGKNEFSQTVGEVFYTKNRNFCLPGVPWNMTVITSLQQELCP 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE2 AVLIPSKPLARRCFPAIHAYKGVLM-VGNETTYEDGHGSRKNITDLVEGAKKANGVLEAR . :.:: : :::: .. .: . :.:: ..: :. :... :.:: CCDS54 SFLLPSAPALGRCFPWTNVTPPALPGITNDTTIQQG------ISGLIDS-------LNAR 100 110 120 130 220 230 240 250 260 270 pF1KE2 QLAMRIFEDYTVSWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFH .....::::.. :::::...: .:...:::::.:::..:: .: :.:. :. ::.:::.. CCDS54 DISVKIFEDFAQSWYWILVALGVALVLSLLFILLLRLVAGPLVLVLILGVLGVLAYGIYY 140 150 160 170 180 190 280 290 300 310 320 330 pF1KE2 CYMEYSRLRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRK :. :: :: . :...: .::: :.. .: ...:::: .:.:..::.:..:.:::::. CCDS54 CWEEYRVLR-DKGASIS--QLGFTTNLSAYQSVQETWLAALIVLAVLEAILLLMLIFLRQ 200 210 220 230 240 250 340 350 360 370 380 390 pF1KE2 RILIAIALIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDD :: :::::.::::.::: .: ...:::::: :: .:::::: ::..:.::.. : .. . CCDS54 RIRIAIALLKEASKAVGQMMSTMFYPLVTFVLLLICIAYWAMTALYLATSGQPQYVLWAS 260 270 280 290 300 310 400 410 420 430 440 450 pF1KE2 ---SP-C---PFTAKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAF :: : :... .::: : : : ::. : : :.... .:....:::.... CCDS54 NISSPGCEKVPINT-SCNP-TAHLVNSS--CPGLMCVFQGYSSKGLIQRSVFNLQIYGVL 320 330 340 350 360 370 460 470 480 490 500 510 pF1KE2 MFFWLANFVLALGQVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALI .:: :.:::::: .:::::::.:::..::.:.:.:::.::: :.:::::::::::::: CCDS54 GLFWTLNWVLALGQCVLAGAFASFYWAFHKPQDIPTFPLISAFIRTLRYHTGSLAFGALI 380 390 400 410 420 430 520 530 540 550 560 570 pF1KE2 LAIVQIIRVILEYLDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGT :..::: ::::::.:..:....: :.:.: :.:::.:::::::::::::::::::::: CCDS54 LTLVQIARVILEYIDHKLRGVQNPVARCIMCCFKCCLWCLEKFIKFLNRNAYIMIAIYGK 440 450 460 470 480 490 580 590 600 610 620 630 pF1KE2 NFCTSARNAFFLLMRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIR-IVQD :::.::.:::.::::::.::.:::::::.:...::::.::.::.:.::::. :: . .: CCDS54 NFCVSAKNAFMLLMRNIVRVVVLDKVTDLLLFFGKLLVVGGVGVLSFFFFSGRIPGLGKD 500 510 520 530 540 550 640 650 660 670 680 pF1KE2 -TAPPLNYYWVPILTVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMS .: :::::.::.: :.:.:.:: :::::.::::::::::::::::::.:: .:::.:: CCDS54 FKSPHLNYYWLPIMTSILGAYVIASGFFSVFGMCVDTLFLCFLEDLERNNGSLDRPYYMS 560 570 580 590 600 610 690 700 pF1KE2 STLKKLLNKTNKKAAES ..: :.:.: :. CCDS54 KSLLKILGKKNEAPPDNKKRKK 620 630 >>CCDS54990.1 SLC44A4 gene_id:80736|Hs108|chr6 (668 aa) initn: 2019 init1: 1178 opt: 1937 Z-score: 2316.8 bits: 439.1 E(32554): 1e-122 Smith-Waterman score: 2354; 51.7% identity (76.6% similar) in 714 aa overlap (3-701:7-658) 10 20 30 40 50 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWT :: . ::: : ::::.:.::: ::.:::.::::..:: :.::..:::.:: CCDS54 MGGKQRDEDDEAYGK---PVKYDPSFRGPIKNRSCTDVICCVLFLLFILGYIVVGIVAWL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 HGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKC--ASPLVLLE---FQCPTPQI .::::.:.:: .: : .::. : .:..::::.:::: .: .: .. . .:::::: CCDS54 YGDPRQVLYPRNSTGAYCGM-G-ENKDKPYLLYFNIFSCILSSNIISVAENGLQCPTPQT 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 CVEKCPDRYLTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLARR . . :.. ::. :.:: : : CCDS54 VITS-------------------------------------LQQELCPSFLLPSAPALGR 120 130 180 190 200 210 220 230 pF1KE2 CFPAIHAYKGVLM-VGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTV ::: .. .: . :.:: ..: :. :... :.::.....::::.. CCDS54 CFPWTNVTPPALPGITNDTTIQQG------ISGLIDS-------LNARDISVKIFEDFAQ 140 150 160 170 180 240 250 260 270 280 290 pF1KE2 SWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEA :::::...: .:...:::::.:::..:: .: :.:. :. ::.:::..:. :: :: . CCDS54 SWYWILVALGVALVLSLLFILLLRLVAGPLVLVLILGVLGVLAYGIYYCWEEYRVLR-DK 190 200 210 220 230 240 300 310 320 330 340 350 pF1KE2 GSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEA :...: .::: :.. .: ...:::: .:.:..::.:..:.:::::.:: :::::.::: CCDS54 GASIS--QLGFTTNLSAYQSVQETWLAALIVLAVLEAILLLMLIFLRQRIRIAIALLKEA 250 260 270 280 290 300 360 370 380 390 400 pF1KE2 SRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDD---SP-C---PF :.::: .: ...:::::: :: .:::::: ::..:.::.. : .. . :: : :. CCDS54 SKAVGQMMSTMFYPLVTFVLLLICIAYWAMTALYLATSGQPQYVLWASNISSPGCEKVPI 310 320 330 340 350 360 410 420 430 440 450 460 pF1KE2 TAKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLAL .. .::: : : : ::. : : :.... .:....:::.... .:: :.:::: CCDS54 NT-SCNP-TAHLVNSS--CPGLMCVFQGYSSKGLIQRSVFNLQIYGVLGLFWTLNWVLAL 370 380 390 400 410 470 480 490 500 510 520 pF1KE2 GQVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILE :: .:::::::.:::..::.:.:.:::.::: :.:::::::::::::::..::: ::::: CCDS54 GQCVLAGAFASFYWAFHKPQDIPTFPLISAFIRTLRYHTGSLAFGALILTLVQIARVILE 420 430 440 450 460 470 530 540 550 560 570 580 pF1KE2 YLDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFL :.:..:....: :.:.: :.:::.:::::::::::::::::::::: :::.::.:::.: CCDS54 YIDHKLRGVQNPVARCIMCCFKCCLWCLEKFIKFLNRNAYIMIAIYGKNFCVSAKNAFML 480 490 500 510 520 530 590 600 610 620 630 640 pF1KE2 LMRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIR-IVQD-TAPPLNYYWVP :::::.::.:::::::.:...::::.::.::.:.::::. :: . .: .: :::::.: CCDS54 LMRNIVRVVVLDKVTDLLLFFGKLLVVGGVGVLSFFFFSGRIPGLGKDFKSPHLNYYWLP 540 550 560 570 580 590 650 660 670 680 690 700 pF1KE2 ILTVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNK :.: :.:.:.:: :::::.::::::::::::::::::.:: .:::.::..: :.:.: :. CCDS54 IMTSILGAYVIASGFFSVFGMCVDTLFLCFLEDLERNNGSLDRPYYMSKSLLKILGKKNE 600 610 620 630 640 650 pF1KE2 KAAES CCDS54 APPDNKKRKK 660 >>CCDS75868.1 SLC44A1 gene_id:23446|Hs108|chr9 (652 aa) initn: 956 init1: 448 opt: 689 Z-score: 821.9 bits: 162.5 E(32554): 1.8e-39 Smith-Waterman score: 976; 28.8% identity (60.2% similar) in 699 aa overlap (25-706:20-636) 10 20 30 40 50 60 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP :. .:.:::: ....: .:. . .. . : CCDS75 MGCCSSASSAAQSSKREWKPLEDRSCTDIPWLLLFILFCIGMGFICGFSIATGAA 10 20 30 40 50 70 80 90 100 110 pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKP----------YLFYFNIVKCASPLVLLEFQCPTPQ ... :: :..::::.:: : : :.:... : : :.. . . CCDS75 ARLVSGYDSYGNICGQKNTKLEAIPNSGMDHTQRKYVFFLD--PCN--LDLINRKIKSVA 60 70 80 90 100 110 120 130 140 150 160 pF1KE2 ICVEKCPDRYLTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSK---P .:: :: . : :. .. . .: ..: .. .. . :: . .:.. : CCDS75 LCVAACPRQELKTLSDVQKFAEINGSALCSYNLKPSEYTTSPKSSVLCPKLPVPASAPIP 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 LARRCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFED . .:: : . .. . . .. . ..: . .::. ... CCDS75 FFHRCAP--------VNISCYAKFAEALITF--VSDNSVLHRLISGVMTSKE-------- 180 190 200 210 230 240 250 260 270 280 pF1KE2 YTVSWYWIIIGL-VIAMAMSLLFIILLRFLAGIMVWVMIIMVIL--VLGYGIFHCYMEYS ::.:: ......:.......:... ..::.. :.::: . : :.. . :. CCDS75 -------IILGLCLLSLVLSMILMVIIRYISRVLVWILTILVILGSLGGTGVL--WWLYA 220 230 240 250 260 290 300 310 320 330 340 pF1KE2 RLRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAI . : :. .: . : .:: . : . : ... ::..:... .:::. ..: CCDS75 KQRRSPKETVTPEQLQIAED-----NLR-ALLIYAISATVFTVILFLIMLVMRKRVALTI 270 280 290 300 310 350 360 370 380 390 400 pF1KE2 ALIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFT ::.. :... .. .. :. ::: : : .:: : .::.:.. : . ... : CCDS75 ALFHVAGKVFIHLPLLVFQPFWTFFALVLFWVYWIMTLLFLGTTGSPVQN--EQGFVEF- 320 330 340 350 360 370 410 420 430 440 450 460 pF1KE2 AKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALG : .: :. .. :: ..:: .:...:.:: CCDS75 -KISGP----------------LQYMWW-----YH--VVGL--------IWISEFILACQ 380 390 400 470 480 490 500 510 520 pF1KE2 QVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEY :.:.::: ..::.. : .:: :.... .: .::: :..: :..:...:.: :.:: : CCDS75 QMTVAGAVVTYYFT-RDKRNLPFTPILASVNRLIRYHLGTVAKGSFIITLVKIPRMILMY 410 420 430 440 450 460 530 540 550 560 570 580 pF1KE2 LDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLL . ..::. :: :.:.. ::.::::: ...::.::: :: .:::::::..:: .: CCDS75 IHSQLKGKENACARCVLKSCICCLWCLEKCLNYLNQNAYTATAINSTNFCTSAKDAFVIL 470 480 490 500 510 520 590 600 610 620 630 640 pF1KE2 MRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWV-PIL ..: .:::... : ::...:::.::: :.:. ........ :: . :: :.. CCDS75 VENALRVATINTVGDFMLFLGKVLIVCSTGLAGIMLLNYQ----QDYT-----VWVLPLI 530 540 550 560 570 650 660 670 680 690 700 pF1KE2 TVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKA : . ..:.:: :.:.: : ::.::::: : . :::: : ..:...: ...... : CCDS75 IVCLFAFLVAHCFLSIYEMVVDVLFLCFAIDTKYNDGSPGREFYMDKVLMEFVENSRKAM 580 590 600 610 620 630 pF1KE2 AES :. CCDS75 KEAGKGGVADSRELKPMIK 640 650 >>CCDS83390.1 SLC44A1 gene_id:23446|Hs108|chr9 (654 aa) initn: 956 init1: 448 opt: 689 Z-score: 821.9 bits: 162.5 E(32554): 1.8e-39 Smith-Waterman score: 976; 28.8% identity (60.2% similar) in 699 aa overlap (25-706:20-636) 10 20 30 40 50 60 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP :. .:.:::: ....: .:. . .. . : CCDS83 MGCCSSASSAAQSSKREWKPLEDRSCTDIPWLLLFILFCIGMGFICGFSIATGAA 10 20 30 40 50 70 80 90 100 110 pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKP----------YLFYFNIVKCASPLVLLEFQCPTPQ ... :: :..::::.:: : : :.:... : : :.. . . CCDS83 ARLVSGYDSYGNICGQKNTKLEAIPNSGMDHTQRKYVFFLD--PCN--LDLINRKIKSVA 60 70 80 90 100 110 120 130 140 150 160 pF1KE2 ICVEKCPDRYLTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSK---P .:: :: . : :. .. . .: ..: .. .. . :: . .:.. : CCDS83 LCVAACPRQELKTLSDVQKFAEINGSALCSYNLKPSEYTTSPKSSVLCPKLPVPASAPIP 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 LARRCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFED . .:: : . .. . . .. . ..: . .::. ... CCDS83 FFHRCAP--------VNISCYAKFAEALITF--VSDNSVLHRLISGVMTSKE-------- 180 190 200 210 230 240 250 260 270 280 pF1KE2 YTVSWYWIIIGL-VIAMAMSLLFIILLRFLAGIMVWVMIIMVIL--VLGYGIFHCYMEYS ::.:: ......:.......:... ..::.. :.::: . : :.. . :. CCDS83 -------IILGLCLLSLVLSMILMVIIRYISRVLVWILTILVILGSLGGTGVL--WWLYA 220 230 240 250 260 290 300 310 320 330 340 pF1KE2 RLRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAI . : :. .: . : .:: . : . : ... ::..:... .:::. ..: CCDS83 KQRRSPKETVTPEQLQIAED-----NLR-ALLIYAISATVFTVILFLIMLVMRKRVALTI 270 280 290 300 310 350 360 370 380 390 400 pF1KE2 ALIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFT ::.. :... .. .. :. ::: : : .:: : .::.:.. : . ... : CCDS83 ALFHVAGKVFIHLPLLVFQPFWTFFALVLFWVYWIMTLLFLGTTGSPVQN--EQGFVEF- 320 330 340 350 360 370 410 420 430 440 450 460 pF1KE2 AKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALG : .: :. .. :: ..:: .:...:.:: CCDS83 -KISGP----------------LQYMWW-----YH--VVGL--------IWISEFILACQ 380 390 400 470 480 490 500 510 520 pF1KE2 QVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEY :.:.::: ..::.. : .:: :.... .: .::: :..: :..:...:.: :.:: : CCDS83 QMTVAGAVVTYYFT-RDKRNLPFTPILASVNRLIRYHLGTVAKGSFIITLVKIPRMILMY 410 420 430 440 450 460 530 540 550 560 570 580 pF1KE2 LDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLL . ..::. :: :.:.. ::.::::: ...::.::: :: .:::::::..:: .: CCDS83 IHSQLKGKENACARCVLKSCICCLWCLEKCLNYLNQNAYTATAINSTNFCTSAKDAFVIL 470 480 490 500 510 520 590 600 610 620 630 640 pF1KE2 MRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWV-PIL ..: .:::... : ::...:::.::: :.:. ........ :: . :: :.. CCDS83 VENALRVATINTVGDFMLFLGKVLIVCSTGLAGIMLLNYQ----QDYT-----VWVLPLI 530 540 550 560 570 650 660 670 680 690 700 pF1KE2 TVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKA : . ..:.:: :.:.: : ::.::::: : . :::: : ..:...: ...... : CCDS83 IVCLFAFLVAHCFLSIYEMVVDVLFLCFAIDTKYNDGSPGREFYMDKVLMEFVENSRKAM 580 590 600 610 620 630 pF1KE2 AES :. CCDS83 KEAGKGGVADSRELKPMLKKR 640 650 >>CCDS6763.1 SLC44A1 gene_id:23446|Hs108|chr9 (657 aa) initn: 956 init1: 448 opt: 689 Z-score: 821.9 bits: 162.5 E(32554): 1.9e-39 Smith-Waterman score: 976; 28.8% identity (60.2% similar) in 699 aa overlap (25-706:20-636) 10 20 30 40 50 60 pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP :. .:.:::: ....: .:. . .. . : CCDS67 MGCCSSASSAAQSSKREWKPLEDRSCTDIPWLLLFILFCIGMGFICGFSIATGAA 10 20 30 40 50 70 80 90 100 110 pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKP----------YLFYFNIVKCASPLVLLEFQCPTPQ ... :: :..::::.:: : : :.:... : : :.. . . CCDS67 ARLVSGYDSYGNICGQKNTKLEAIPNSGMDHTQRKYVFFLD--PCN--LDLINRKIKSVA 60 70 80 90 100 110 120 130 140 150 160 pF1KE2 ICVEKCPDRYLTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSK---P .:: :: . : :. .. . .: ..: .. .. . :: . .:.. : CCDS67 LCVAACPRQELKTLSDVQKFAEINGSALCSYNLKPSEYTTSPKSSVLCPKLPVPASAPIP 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 LARRCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFED . .:: : . .. . . .. . ..: . .::. ... CCDS67 FFHRCAP--------VNISCYAKFAEALITF--VSDNSVLHRLISGVMTSKE-------- 180 190 200 210 230 240 250 260 270 280 pF1KE2 YTVSWYWIIIGL-VIAMAMSLLFIILLRFLAGIMVWVMIIMVIL--VLGYGIFHCYMEYS ::.:: ......:.......:... ..::.. :.::: . : :.. . :. CCDS67 -------IILGLCLLSLVLSMILMVIIRYISRVLVWILTILVILGSLGGTGVL--WWLYA 220 230 240 250 260 290 300 310 320 330 340 pF1KE2 RLRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAI . : :. .: . : .:: . : . : ... ::..:... .:::. ..: CCDS67 KQRRSPKETVTPEQLQIAED-----NLR-ALLIYAISATVFTVILFLIMLVMRKRVALTI 270 280 290 300 310 350 360 370 380 390 400 pF1KE2 ALIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFT ::.. :... .. .. :. ::: : : .:: : .::.:.. : . ... : CCDS67 ALFHVAGKVFIHLPLLVFQPFWTFFALVLFWVYWIMTLLFLGTTGSPVQN--EQGFVEF- 320 330 340 350 360 370 410 420 430 440 450 460 pF1KE2 AKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALG : .: :. .. :: ..:: .:...:.:: CCDS67 -KISGP----------------LQYMWW-----YH--VVGL--------IWISEFILACQ 380 390 400 470 480 490 500 510 520 pF1KE2 QVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEY :.:.::: ..::.. : .:: :.... .: .::: :..: :..:...:.: :.:: : CCDS67 QMTVAGAVVTYYFT-RDKRNLPFTPILASVNRLIRYHLGTVAKGSFIITLVKIPRMILMY 410 420 430 440 450 460 530 540 550 560 570 580 pF1KE2 LDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLL . ..::. :: :.:.. ::.::::: ...::.::: :: .:::::::..:: .: CCDS67 IHSQLKGKENACARCVLKSCICCLWCLEKCLNYLNQNAYTATAINSTNFCTSAKDAFVIL 470 480 490 500 510 520 590 600 610 620 630 640 pF1KE2 MRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWV-PIL ..: .:::... : ::...:::.::: :.:. ........ :: . :: :.. CCDS67 VENALRVATINTVGDFMLFLGKVLIVCSTGLAGIMLLNYQ----QDYT-----VWVLPLI 530 540 550 560 570 650 660 670 680 690 700 pF1KE2 TVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKA : . ..:.:: :.:.: : ::.::::: : . :::: : ..:...: ...... : CCDS67 IVCLFAFLVAHCFLSIYEMVVDVLFLCFAIDTKYNDGSPGREFYMDKVLMEFVENSRKAM 580 590 600 610 620 630 pF1KE2 AES :. CCDS67 KEAGKGGVADSRELKPMASGASSA 640 650 706 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 17:01:35 2016 done: Tue Nov 8 17:01:36 2016 Total Scan time: 2.500 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]