FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2606, 706 aa
1>>>pF1KE2606 706 - 706 aa - 706 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4329+/-0.00108; mu= 19.0794+/- 0.065
mean_var=69.6848+/-13.873, 0's: 0 Z-trim(103.3): 28 B-trim: 50 in 1/49
Lambda= 0.153640
statistics sampled from 7336 (7356) to 7336 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.57), E-opt: 0.2 (0.226), width: 16
Scan time: 2.500
The best scores are: opt bits E(32554)
CCDS12245.1 SLC44A2 gene_id:57153|Hs108|chr19 ( 706) 4778 1068.9 0
CCDS54216.1 SLC44A2 gene_id:57153|Hs108|chr19 ( 704) 4702 1052.0 0
CCDS44164.1 SLC44A5 gene_id:204962|Hs108|chr1 ( 717) 2889 650.1 3.2e-186
CCDS667.1 SLC44A5 gene_id:204962|Hs108|chr1 ( 719) 2880 648.2 1.3e-185
CCDS4724.2 SLC44A4 gene_id:80736|Hs108|chr6 ( 710) 2350 530.7 2.9e-150
CCDS54989.1 SLC44A4 gene_id:80736|Hs108|chr6 ( 634) 2023 458.2 1.7e-128
CCDS54990.1 SLC44A4 gene_id:80736|Hs108|chr6 ( 668) 1937 439.1 1e-122
CCDS75868.1 SLC44A1 gene_id:23446|Hs108|chr9 ( 652) 689 162.5 1.8e-39
CCDS83390.1 SLC44A1 gene_id:23446|Hs108|chr9 ( 654) 689 162.5 1.8e-39
CCDS6763.1 SLC44A1 gene_id:23446|Hs108|chr9 ( 657) 689 162.5 1.9e-39
CCDS58011.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 620) 624 148.1 3.8e-35
CCDS72827.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 573) 615 146.0 1.4e-34
CCDS58012.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 585) 615 146.1 1.5e-34
CCDS751.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 605) 615 146.1 1.5e-34
CCDS58013.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 617) 615 146.1 1.5e-34
CCDS44176.1 SLC44A3 gene_id:126969|Hs108|chr1 ( 653) 615 146.1 1.6e-34
>>CCDS12245.1 SLC44A2 gene_id:57153|Hs108|chr19 (706 aa)
initn: 4778 init1: 4778 opt: 4778 Z-score: 5719.8 bits: 1068.9 E(32554): 0
Smith-Waterman score: 4778; 99.9% identity (100.0% similar) in 706 aa overlap (1-706:1-706)
10 20 30 40 50 60
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEKCPDRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEKCPDRY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 LTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLARRCFPAIHAYK
:::::::::::::::::::::::::::::::::.::::::::::::::::::::::::::
CCDS12 LTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLQDGDCPAVLIPSKPLARRCFPAIHAYK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 GVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTVSWYWIIIGLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTVSWYWIIIGLV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 IAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEAGSDVSLVDLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 IAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEAGSDVSLVDLG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 FQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEASRAVGYVMCS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 FQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEASRAVGYVMCS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 LLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFTAKTCNPETFPSSNESR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFTAKTCNPETFPSSNESR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 QCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLAGAFASYYWALR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLAGAFASYYWALR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 KPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRLKAAENKFAKCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRLKAAENKFAKCL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 MTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNIIRVAVLDKVTDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNIIRVAVLDKVTDF
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 LFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGSYLIAHGFFSVY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGSYLIAHGFFSVY
610 620 630 640 650 660
670 680 690 700
pF1KE2 GMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES
::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES
670 680 690 700
>>CCDS54216.1 SLC44A2 gene_id:57153|Hs108|chr19 (704 aa)
initn: 4691 init1: 4691 opt: 4702 Z-score: 5628.7 bits: 1052.0 E(32554): 0
Smith-Waterman score: 4702; 98.9% identity (99.3% similar) in 706 aa overlap (1-706:1-704)
10 20 30 40 50 60
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP
: ::: . : .::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MEDERKN--GAYGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEKCPDRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEKCPDRY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 LTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLARRCFPAIHAYK
:::::::::::::::::::::::::::::::::.::::::::::::::::::::::::::
CCDS54 LTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLQDGDCPAVLIPSKPLARRCFPAIHAYK
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 GVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTVSWYWIIIGLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTVSWYWIIIGLV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 IAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEAGSDVSLVDLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 IAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEAGSDVSLVDLG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE2 FQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEASRAVGYVMCS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 FQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEASRAVGYVMCS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE2 LLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFTAKTCNPETFPSSNESR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFTAKTCNPETFPSSNESR
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE2 QCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLAGAFASYYWALR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLAGAFASYYWALR
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE2 KPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRLKAAENKFAKCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRLKAAENKFAKCL
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE2 MTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNIIRVAVLDKVTDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNIIRVAVLDKVTDF
540 550 560 570 580 590
610 620 630 640 650 660
pF1KE2 LFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGSYLIAHGFFSVY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGSYLIAHGFFSVY
600 610 620 630 640 650
670 680 690 700
pF1KE2 GMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES
::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES
660 670 680 690 700
>>CCDS44164.1 SLC44A5 gene_id:204962|Hs108|chr1 (717 aa)
initn: 2902 init1: 1389 opt: 2889 Z-score: 3456.8 bits: 650.1 E(32554): 3.2e-186
Smith-Waterman score: 2889; 54.9% identity (83.8% similar) in 705 aa overlap (4-702:9-713)
10 20 30 40 50
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAW
. : : :. ::: ::::. ::.:::..::...:: :.::...:..::
CCDS44 MNDTEKPADTPSEEEDFGDPRTYDPDFKGPVANRSCTDVLCCMIFLLCIIGYIVLGLVAW
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 THGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEK
.:::::.. :::::.:.::::::: :::: :::::...:.:: :::..:::: :::: :
CCDS44 VHGDPRRAAYPTDSQGHFCGQKGTPNENKTILFYFNLLRCTSPSVLLNLQCPTTQICVSK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 CPDRYLTYLNAR--SSRD---FEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLAR
::...:::.. . ..: .: :.::: : :.....: : :::....::::. .
CCDS44 CPEKFLTYVEMQLLYTKDKSYWEDYRQFCKTTAKPVKSLTQLLLDDDCPTAIFPSKPFLQ
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 RCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTV
:::: . . .:.: .:.. ..::.:. .....: .:. : .:.:..:....::::.
CCDS44 RCFPDFSTKNGTLTIGSKMMFQDGNGGTRSVVELGIAANGINKLLDAKSLGLKVFEDYAR
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE2 SWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEA
.::::.:::.:::..: .:.:::::.:: . ::..: :: ..::::.:::..:. :. .
CCDS44 TWYWILIGLTIAMVLSWIFLILLRFIAGCLFWVFMIGVIGIIGYGIWHCYQQYTNLQERP
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE2 GSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEA
.: ... :.:.::.. .:..:.:::..::::: :.:::.::.:::::.:: .:: :.::.
CCDS44 SSVLTIYDIGIQTNISMYFELQQTWFTFMIILCIIEVIVILMLIFLRNRIRVAIILLKEG
310 320 330 340 350 360
360 370 380 390 400
pF1KE2 SRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIF-DDSPCPFTAKTCN
:.:.::: .:.:: .::.:: .:: ::. :::::.::. :::.. . : .::.
CCDS44 SKAIGYVPSTLVYPALTFILLSICICYWVVTAVFLATSGVPVYKVIAPGGHCIHENQTCD
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE2 PETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLA
:: : ... .. ::.: :.::::::.: ::. . ....: :.:.:: :::.:::: .::
CCDS44 PEIFNTTEIAKACPGALCNFAFYGGKSLYHQYIPTFHVYNLFVFLWLINFVIALGQCALA
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE2 GAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRL
::::.::::..::::.: .:::.:::::.::::::::::.::.:..:.....:::::.::
CCDS44 GAFATYYWAMKKPDDIPRYPLFTAFGRAIRYHTGSLAFGSLIIALIQMFKIVLEYLDHRL
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE2 KAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNII
: ..: ..: :. ::.:::::::. :::::::::::::::: ::: ::..:: :::::..
CCDS44 KRTQNTLSKFLQCCLRCCFWCLENAIKFLNRNAYIMIAIYGRNFCRSAKDAFNLLMRNVL
550 560 570 580 590 600
590 600 610 620 630 640
pF1KE2 RVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGS
.::: :.:: :...:::::..::.:.:::.:::.:. .. . :::::::.:::: ::
CCDS44 KVAVTDEVTYFVLFLGKLLVAGSIGVLAFLFFTQRLPVIAQGPASLNYYWVPLLTVIFGS
610 620 630 640 650 660
650 660 670 680 690 700
pF1KE2 YLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES
:::::::::::.:::.:.:.::::::::::::. :::..:. : :.... : .
CCDS44 YLIAHGFFSVYAMCVETIFICFLEDLERNDGSTARPYYVSQPLLKIFQEENPQTRKQ
670 680 690 700 710
>>CCDS667.1 SLC44A5 gene_id:204962|Hs108|chr1 (719 aa)
initn: 2893 init1: 1380 opt: 2880 Z-score: 3446.0 bits: 648.2 E(32554): 1.3e-185
Smith-Waterman score: 2880; 55.1% identity (83.9% similar) in 701 aa overlap (4-698:9-709)
10 20 30 40 50
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAW
. : : :. ::: ::::. ::.:::..::...:: :.::...:..::
CCDS66 MNDTEKPADTPSEEEDFGDPRTYDPDFKGPVANRSCTDVLCCMIFLLCIIGYIVLGLVAW
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 THGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKCASPLVLLEFQCPTPQICVEK
.:::::.. :::::.:.::::::: :::: :::::...:.:: :::..:::: :::: :
CCDS66 VHGDPRRAAYPTDSQGHFCGQKGTPNENKTILFYFNLLRCTSPSVLLNLQCPTTQICVSK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 CPDRYLTYLNAR--SSRD---FEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLAR
::...:::.. . ..: .: :.::: : :.....: : :::....::::. .
CCDS66 CPEKFLTYVEMQLLYTKDKSYWEDYRQFCKTTAKPVKSLTQLLLDDDCPTAIFPSKPFLQ
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 RCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTV
:::: . . .:.: .:.. ..::.:. .....: .:. : .:.:..:....::::.
CCDS66 RCFPDFSTKNGTLTIGSKMMFQDGNGGTRSVVELGIAANGINKLLDAKSLGLKVFEDYAR
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE2 SWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEA
.::::.:::.:::..: .:.:::::.:: . ::..: :: ..::::.:::..:. :. .
CCDS66 TWYWILIGLTIAMVLSWIFLILLRFIAGCLFWVFMIGVIGIIGYGIWHCYQQYTNLQERP
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE2 GSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEA
.: ... :.:.::.. .:..:.:::..::::: :.:::.::.:::::.:: .:: :.::.
CCDS66 SSVLTIYDIGIQTNISMYFELQQTWFTFMIILCIIEVIVILMLIFLRNRIRVAIILLKEG
310 320 330 340 350 360
360 370 380 390 400
pF1KE2 SRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIF-DDSPCPFTAKTCN
:.:.::: .:.:: .::.:: .:: ::. :::::.::. :::.. . : .::.
CCDS66 SKAIGYVPSTLVYPALTFILLSICICYWVVTAVFLATSGVPVYKVIAPGGHCIHENQTCD
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE2 PETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALGQVTLA
:: : ... .. ::.: :.::::::.: ::. . ....: :.:.:: :::.:::: .::
CCDS66 PEIFNTTEIAKACPGALCNFAFYGGKSLYHQYIPTFHVYNLFVFLWLINFVIALGQCALA
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE2 GAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEYLDQRL
::::.::::..::::.: .:::.:::::.::::::::::.::.:..:.....:::::.::
CCDS66 GAFATYYWAMKKPDDIPRYPLFTAFGRAIRYHTGSLAFGSLIIALIQMFKIVLEYLDHRL
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE2 KAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLLMRNII
: ..: ..: :. ::.:::::::. :::::::::::::::: ::: ::..:: :::::..
CCDS66 KRTQNTLSKFLQCCLRCCFWCLENAIKFLNRNAYIMIAIYGRNFCRSAKDAFNLLMRNVL
550 560 570 580 590 600
590 600 610 620 630 640
pF1KE2 RVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWVPILTVIVGS
.::: :.:: :...:::::..::.:.:::.:::.:. .. . :::::::.:::: ::
CCDS66 KVAVTDEVTYFVLFLGKLLVAGSIGVLAFLFFTQRLPVIAQGPASLNYYWVPLLTVIFGS
610 620 630 640 650 660
650 660 670 680 690 700
pF1KE2 YLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKAAES
:::::::::::.:::.:.:.:: :::::::::.:.:::.. .:. .: :
CCDS66 YLIAHGFFSVYAMCVETIFICFCEDLERNDGSTEKPYFVTPNLHGILIKKQLVPQKQKE
670 680 690 700 710
>>CCDS4724.2 SLC44A4 gene_id:80736|Hs108|chr6 (710 aa)
initn: 2047 init1: 1178 opt: 2350 Z-score: 2811.1 bits: 530.7 E(32554): 2.9e-150
Smith-Waterman score: 2500; 53.3% identity (79.0% similar) in 719 aa overlap (3-701:7-700)
10 20 30 40 50
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWT
:: . ::: : ::::.:.::: ::.:::.::::..:: :.::..:::.::
CCDS47 MGGKQRDEDDEAYGK---PVKYDPSFRGPIKNRSCTDVICCVLFLLFILGYIVVGIVAWL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 HGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKC--ASPLVLLE---FQCPTPQI
.::::.:.:: .: : .::. : .:..::::.:::: .: .: .. . .::::::.
CCDS47 YGDPRQVLYPRNSTGAYCGM-G-ENKDKPYLLYFNIFSCILSSNIISVAENGLQCPTPQV
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 CVEKCP-DRYLTYLNARSSRDFEYY----KQFCVPGFKNNKGVAEVLRDGDCPAVLIPSK
:: .:: : . . : :. : . ..::.:: : : :.. ::. :.::
CCDS47 CVSSCPEDPWTVGKNEFSQTVGEVFYTKNRNFCLPGVPWNMTVITSLQQELCPSFLLPSA
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 PLARRCFPAIHAYKGVLM-VGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIF
: :::: .. .: . :.:: ..: :. :... :.::.....::
CCDS47 PALGRCFPWTNVTPPALPGITNDTTIQQG------ISGLIDS-------LNARDISVKIF
180 190 200 210 220
230 240 250 260 270 280
pF1KE2 EDYTVSWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSR
::.. :::::...: .:...:::::.:::..:: .: :.:. :. ::.:::..:. ::
CCDS47 EDFAQSWYWILVALGVALVLSLLFILLLRLVAGPLVLVLILGVLGVLAYGIYYCWEEYRV
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE2 LRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIA
:: . :...: .::: :.. .: ...:::: .:.:..::.:..:.:::::.:: ::::
CCDS47 LR-DKGASIS--QLGFTTNLSAYQSVQETWLAALIVLAVLEAILLLMLIFLRQRIRIAIA
290 300 310 320 330
350 360 370 380 390 400
pF1KE2 LIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDD---SP-C
:.::::.::: .: ...:::::: :: .:::::: ::..:.::.. : .. . :: :
CCDS47 LLKEASKAVGQMMSTMFYPLVTFVLLLICIAYWAMTALYLATSGQPQYVLWASNISSPGC
340 350 360 370 380 390
410 420 430 440 450
pF1KE2 ---PFTAKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLAN
:... .::: : : : ::. : : :.... .:....:::.... .:: :
CCDS47 EKVPINT-SCNP-TAHLVNSS--CPGLMCVFQGYSSKGLIQRSVFNLQIYGVLGLFWTLN
400 410 420 430 440 450
460 470 480 490 500 510
pF1KE2 FVLALGQVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQII
.:::::: .:::::::.:::..::.:.:.:::.::: :.:::::::::::::::..:::
CCDS47 WVLALGQCVLAGAFASFYWAFHKPQDIPTFPLISAFIRTLRYHTGSLAFGALILTLVQIA
460 470 480 490 500 510
520 530 540 550 560 570
pF1KE2 RVILEYLDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSAR
::::::.:..:....: :.:.: :.:::.:::::::::::::::::::::: :::.::.
CCDS47 RVILEYIDHKLRGVQNPVARCIMCCFKCCLWCLEKFIKFLNRNAYIMIAIYGKNFCVSAK
520 530 540 550 560 570
580 590 600 610 620 630
pF1KE2 NAFFLLMRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIR-IVQD-TAPPLN
:::.::::::.::.:::::::.:...::::.::.::.:.::::. :: . .: .: ::
CCDS47 NAFMLLMRNIVRVVVLDKVTDLLLFFGKLLVVGGVGVLSFFFFSGRIPGLGKDFKSPHLN
580 590 600 610 620 630
640 650 660 670 680 690
pF1KE2 YYWVPILTVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLL
:::.::.: :.:.:.:: :::::.::::::::::::::::::.:: .:::.::..: :.:
CCDS47 YYWLPIMTSILGAYVIASGFFSVFGMCVDTLFLCFLEDLERNNGSLDRPYYMSKSLLKIL
640 650 660 670 680 690
700
pF1KE2 NKTNKKAAES
.: :.
CCDS47 GKKNEAPPDNKKRKK
700 710
>>CCDS54989.1 SLC44A4 gene_id:80736|Hs108|chr6 (634 aa)
initn: 1787 init1: 1178 opt: 2023 Z-score: 2420.2 bits: 458.2 E(32554): 1.7e-128
Smith-Waterman score: 2173; 52.6% identity (78.8% similar) in 642 aa overlap (80-701:3-624)
50 60 70 80 90 100
pF1KE2 VGIIAWTHGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKC--ASPLVLLE---F
.:..::::.:::: .: .: .. . .
CCDS54 MGENKDKPYLLYFNIFSCILSSNIISVAENGL
10 20 30
110 120 130 140 150
pF1KE2 QCPTPQICVEKCP-DRYLTYLNARSSRDFEYY----KQFCVPGFKNNKGVAEVLRDGDCP
::::::.:: .:: : . . : :. : . ..::.:: : : :.. ::
CCDS54 QCPTPQVCVSSCPEDPWTVGKNEFSQTVGEVFYTKNRNFCLPGVPWNMTVITSLQQELCP
40 50 60 70 80 90
160 170 180 190 200 210
pF1KE2 AVLIPSKPLARRCFPAIHAYKGVLM-VGNETTYEDGHGSRKNITDLVEGAKKANGVLEAR
. :.:: : :::: .. .: . :.:: ..: :. :... :.::
CCDS54 SFLLPSAPALGRCFPWTNVTPPALPGITNDTTIQQG------ISGLIDS-------LNAR
100 110 120 130
220 230 240 250 260 270
pF1KE2 QLAMRIFEDYTVSWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFH
.....::::.. :::::...: .:...:::::.:::..:: .: :.:. :. ::.:::..
CCDS54 DISVKIFEDFAQSWYWILVALGVALVLSLLFILLLRLVAGPLVLVLILGVLGVLAYGIYY
140 150 160 170 180 190
280 290 300 310 320 330
pF1KE2 CYMEYSRLRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRK
:. :: :: . :...: .::: :.. .: ...:::: .:.:..::.:..:.:::::.
CCDS54 CWEEYRVLR-DKGASIS--QLGFTTNLSAYQSVQETWLAALIVLAVLEAILLLMLIFLRQ
200 210 220 230 240 250
340 350 360 370 380 390
pF1KE2 RILIAIALIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDD
:: :::::.::::.::: .: ...:::::: :: .:::::: ::..:.::.. : .. .
CCDS54 RIRIAIALLKEASKAVGQMMSTMFYPLVTFVLLLICIAYWAMTALYLATSGQPQYVLWAS
260 270 280 290 300 310
400 410 420 430 440 450
pF1KE2 ---SP-C---PFTAKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAF
:: : :... .::: : : : ::. : : :.... .:....:::....
CCDS54 NISSPGCEKVPINT-SCNP-TAHLVNSS--CPGLMCVFQGYSSKGLIQRSVFNLQIYGVL
320 330 340 350 360 370
460 470 480 490 500 510
pF1KE2 MFFWLANFVLALGQVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALI
.:: :.:::::: .:::::::.:::..::.:.:.:::.::: :.::::::::::::::
CCDS54 GLFWTLNWVLALGQCVLAGAFASFYWAFHKPQDIPTFPLISAFIRTLRYHTGSLAFGALI
380 390 400 410 420 430
520 530 540 550 560 570
pF1KE2 LAIVQIIRVILEYLDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGT
:..::: ::::::.:..:....: :.:.: :.:::.::::::::::::::::::::::
CCDS54 LTLVQIARVILEYIDHKLRGVQNPVARCIMCCFKCCLWCLEKFIKFLNRNAYIMIAIYGK
440 450 460 470 480 490
580 590 600 610 620 630
pF1KE2 NFCTSARNAFFLLMRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIR-IVQD
:::.::.:::.::::::.::.:::::::.:...::::.::.::.:.::::. :: . .:
CCDS54 NFCVSAKNAFMLLMRNIVRVVVLDKVTDLLLFFGKLLVVGGVGVLSFFFFSGRIPGLGKD
500 510 520 530 540 550
640 650 660 670 680
pF1KE2 -TAPPLNYYWVPILTVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMS
.: :::::.::.: :.:.:.:: :::::.::::::::::::::::::.:: .:::.::
CCDS54 FKSPHLNYYWLPIMTSILGAYVIASGFFSVFGMCVDTLFLCFLEDLERNNGSLDRPYYMS
560 570 580 590 600 610
690 700
pF1KE2 STLKKLLNKTNKKAAES
..: :.:.: :.
CCDS54 KSLLKILGKKNEAPPDNKKRKK
620 630
>>CCDS54990.1 SLC44A4 gene_id:80736|Hs108|chr6 (668 aa)
initn: 2019 init1: 1178 opt: 1937 Z-score: 2316.8 bits: 439.1 E(32554): 1e-122
Smith-Waterman score: 2354; 51.7% identity (76.6% similar) in 714 aa overlap (3-701:7-658)
10 20 30 40 50
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWT
:: . ::: : ::::.:.::: ::.:::.::::..:: :.::..:::.::
CCDS54 MGGKQRDEDDEAYGK---PVKYDPSFRGPIKNRSCTDVICCVLFLLFILGYIVVGIVAWL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 HGDPRKVIYPTDSRGEFCGQKGTKNENKPYLFYFNIVKC--ASPLVLLE---FQCPTPQI
.::::.:.:: .: : .::. : .:..::::.:::: .: .: .. . .::::::
CCDS54 YGDPRQVLYPRNSTGAYCGM-G-ENKDKPYLLYFNIFSCILSSNIISVAENGLQCPTPQT
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 CVEKCPDRYLTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSKPLARR
. . :.. ::. :.:: : :
CCDS54 VITS-------------------------------------LQQELCPSFLLPSAPALGR
120 130
180 190 200 210 220 230
pF1KE2 CFPAIHAYKGVLM-VGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFEDYTV
::: .. .: . :.:: ..: :. :... :.::.....::::..
CCDS54 CFPWTNVTPPALPGITNDTTIQQG------ISGLIDS-------LNARDISVKIFEDFAQ
140 150 160 170 180
240 250 260 270 280 290
pF1KE2 SWYWIIIGLVIAMAMSLLFIILLRFLAGIMVWVMIIMVILVLGYGIFHCYMEYSRLRGEA
:::::...: .:...:::::.:::..:: .: :.:. :. ::.:::..:. :: :: .
CCDS54 SWYWILVALGVALVLSLLFILLLRLVAGPLVLVLILGVLGVLAYGIYYCWEEYRVLR-DK
190 200 210 220 230 240
300 310 320 330 340 350
pF1KE2 GSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAIALIKEA
:...: .::: :.. .: ...:::: .:.:..::.:..:.:::::.:: :::::.:::
CCDS54 GASIS--QLGFTTNLSAYQSVQETWLAALIVLAVLEAILLLMLIFLRQRIRIAIALLKEA
250 260 270 280 290 300
360 370 380 390 400
pF1KE2 SRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDD---SP-C---PF
:.::: .: ...:::::: :: .:::::: ::..:.::.. : .. . :: : :.
CCDS54 SKAVGQMMSTMFYPLVTFVLLLICIAYWAMTALYLATSGQPQYVLWASNISSPGCEKVPI
310 320 330 340 350 360
410 420 430 440 450 460
pF1KE2 TAKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLAL
.. .::: : : : ::. : : :.... .:....:::.... .:: :.::::
CCDS54 NT-SCNP-TAHLVNSS--CPGLMCVFQGYSSKGLIQRSVFNLQIYGVLGLFWTLNWVLAL
370 380 390 400 410
470 480 490 500 510 520
pF1KE2 GQVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILE
:: .:::::::.:::..::.:.:.:::.::: :.:::::::::::::::..::: :::::
CCDS54 GQCVLAGAFASFYWAFHKPQDIPTFPLISAFIRTLRYHTGSLAFGALILTLVQIARVILE
420 430 440 450 460 470
530 540 550 560 570 580
pF1KE2 YLDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFL
:.:..:....: :.:.: :.:::.:::::::::::::::::::::: :::.::.:::.:
CCDS54 YIDHKLRGVQNPVARCIMCCFKCCLWCLEKFIKFLNRNAYIMIAIYGKNFCVSAKNAFML
480 490 500 510 520 530
590 600 610 620 630 640
pF1KE2 LMRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIR-IVQD-TAPPLNYYWVP
:::::.::.:::::::.:...::::.::.::.:.::::. :: . .: .: :::::.:
CCDS54 LMRNIVRVVVLDKVTDLLLFFGKLLVVGGVGVLSFFFFSGRIPGLGKDFKSPHLNYYWLP
540 550 560 570 580 590
650 660 670 680 690 700
pF1KE2 ILTVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNK
:.: :.:.:.:: :::::.::::::::::::::::::.:: .:::.::..: :.:.: :.
CCDS54 IMTSILGAYVIASGFFSVFGMCVDTLFLCFLEDLERNNGSLDRPYYMSKSLLKILGKKNE
600 610 620 630 640 650
pF1KE2 KAAES
CCDS54 APPDNKKRKK
660
>>CCDS75868.1 SLC44A1 gene_id:23446|Hs108|chr9 (652 aa)
initn: 956 init1: 448 opt: 689 Z-score: 821.9 bits: 162.5 E(32554): 1.8e-39
Smith-Waterman score: 976; 28.8% identity (60.2% similar) in 699 aa overlap (25-706:20-636)
10 20 30 40 50 60
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP
:. .:.:::: ....: .:. . .. . :
CCDS75 MGCCSSASSAAQSSKREWKPLEDRSCTDIPWLLLFILFCIGMGFICGFSIATGAA
10 20 30 40 50
70 80 90 100 110
pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKP----------YLFYFNIVKCASPLVLLEFQCPTPQ
... :: :..::::.:: : : :.:... : : :.. . .
CCDS75 ARLVSGYDSYGNICGQKNTKLEAIPNSGMDHTQRKYVFFLD--PCN--LDLINRKIKSVA
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 ICVEKCPDRYLTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSK---P
.:: :: . : :. .. . .: ..: .. .. . :: . .:.. :
CCDS75 LCVAACPRQELKTLSDVQKFAEINGSALCSYNLKPSEYTTSPKSSVLCPKLPVPASAPIP
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 LARRCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFED
. .:: : . .. . . .. . ..: . .::. ...
CCDS75 FFHRCAP--------VNISCYAKFAEALITF--VSDNSVLHRLISGVMTSKE--------
180 190 200 210
230 240 250 260 270 280
pF1KE2 YTVSWYWIIIGL-VIAMAMSLLFIILLRFLAGIMVWVMIIMVIL--VLGYGIFHCYMEYS
::.:: ......:.......:... ..::.. :.::: . : :.. . :.
CCDS75 -------IILGLCLLSLVLSMILMVIIRYISRVLVWILTILVILGSLGGTGVL--WWLYA
220 230 240 250 260
290 300 310 320 330 340
pF1KE2 RLRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAI
. : :. .: . : .:: . : . : ... ::..:... .:::. ..:
CCDS75 KQRRSPKETVTPEQLQIAED-----NLR-ALLIYAISATVFTVILFLIMLVMRKRVALTI
270 280 290 300 310
350 360 370 380 390 400
pF1KE2 ALIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFT
::.. :... .. .. :. ::: : : .:: : .::.:.. : . ... :
CCDS75 ALFHVAGKVFIHLPLLVFQPFWTFFALVLFWVYWIMTLLFLGTTGSPVQN--EQGFVEF-
320 330 340 350 360 370
410 420 430 440 450 460
pF1KE2 AKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALG
: .: :. .. :: ..:: .:...:.::
CCDS75 -KISGP----------------LQYMWW-----YH--VVGL--------IWISEFILACQ
380 390 400
470 480 490 500 510 520
pF1KE2 QVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEY
:.:.::: ..::.. : .:: :.... .: .::: :..: :..:...:.: :.:: :
CCDS75 QMTVAGAVVTYYFT-RDKRNLPFTPILASVNRLIRYHLGTVAKGSFIITLVKIPRMILMY
410 420 430 440 450 460
530 540 550 560 570 580
pF1KE2 LDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLL
. ..::. :: :.:.. ::.::::: ...::.::: :: .:::::::..:: .:
CCDS75 IHSQLKGKENACARCVLKSCICCLWCLEKCLNYLNQNAYTATAINSTNFCTSAKDAFVIL
470 480 490 500 510 520
590 600 610 620 630 640
pF1KE2 MRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWV-PIL
..: .:::... : ::...:::.::: :.:. ........ :: . :: :..
CCDS75 VENALRVATINTVGDFMLFLGKVLIVCSTGLAGIMLLNYQ----QDYT-----VWVLPLI
530 540 550 560 570
650 660 670 680 690 700
pF1KE2 TVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKA
: . ..:.:: :.:.: : ::.::::: : . :::: : ..:...: ...... :
CCDS75 IVCLFAFLVAHCFLSIYEMVVDVLFLCFAIDTKYNDGSPGREFYMDKVLMEFVENSRKAM
580 590 600 610 620 630
pF1KE2 AES
:.
CCDS75 KEAGKGGVADSRELKPMIK
640 650
>>CCDS83390.1 SLC44A1 gene_id:23446|Hs108|chr9 (654 aa)
initn: 956 init1: 448 opt: 689 Z-score: 821.9 bits: 162.5 E(32554): 1.8e-39
Smith-Waterman score: 976; 28.8% identity (60.2% similar) in 699 aa overlap (25-706:20-636)
10 20 30 40 50 60
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP
:. .:.:::: ....: .:. . .. . :
CCDS83 MGCCSSASSAAQSSKREWKPLEDRSCTDIPWLLLFILFCIGMGFICGFSIATGAA
10 20 30 40 50
70 80 90 100 110
pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKP----------YLFYFNIVKCASPLVLLEFQCPTPQ
... :: :..::::.:: : : :.:... : : :.. . .
CCDS83 ARLVSGYDSYGNICGQKNTKLEAIPNSGMDHTQRKYVFFLD--PCN--LDLINRKIKSVA
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 ICVEKCPDRYLTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSK---P
.:: :: . : :. .. . .: ..: .. .. . :: . .:.. :
CCDS83 LCVAACPRQELKTLSDVQKFAEINGSALCSYNLKPSEYTTSPKSSVLCPKLPVPASAPIP
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 LARRCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFED
. .:: : . .. . . .. . ..: . .::. ...
CCDS83 FFHRCAP--------VNISCYAKFAEALITF--VSDNSVLHRLISGVMTSKE--------
180 190 200 210
230 240 250 260 270 280
pF1KE2 YTVSWYWIIIGL-VIAMAMSLLFIILLRFLAGIMVWVMIIMVIL--VLGYGIFHCYMEYS
::.:: ......:.......:... ..::.. :.::: . : :.. . :.
CCDS83 -------IILGLCLLSLVLSMILMVIIRYISRVLVWILTILVILGSLGGTGVL--WWLYA
220 230 240 250 260
290 300 310 320 330 340
pF1KE2 RLRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAI
. : :. .: . : .:: . : . : ... ::..:... .:::. ..:
CCDS83 KQRRSPKETVTPEQLQIAED-----NLR-ALLIYAISATVFTVILFLIMLVMRKRVALTI
270 280 290 300 310
350 360 370 380 390 400
pF1KE2 ALIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFT
::.. :... .. .. :. ::: : : .:: : .::.:.. : . ... :
CCDS83 ALFHVAGKVFIHLPLLVFQPFWTFFALVLFWVYWIMTLLFLGTTGSPVQN--EQGFVEF-
320 330 340 350 360 370
410 420 430 440 450 460
pF1KE2 AKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALG
: .: :. .. :: ..:: .:...:.::
CCDS83 -KISGP----------------LQYMWW-----YH--VVGL--------IWISEFILACQ
380 390 400
470 480 490 500 510 520
pF1KE2 QVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEY
:.:.::: ..::.. : .:: :.... .: .::: :..: :..:...:.: :.:: :
CCDS83 QMTVAGAVVTYYFT-RDKRNLPFTPILASVNRLIRYHLGTVAKGSFIITLVKIPRMILMY
410 420 430 440 450 460
530 540 550 560 570 580
pF1KE2 LDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLL
. ..::. :: :.:.. ::.::::: ...::.::: :: .:::::::..:: .:
CCDS83 IHSQLKGKENACARCVLKSCICCLWCLEKCLNYLNQNAYTATAINSTNFCTSAKDAFVIL
470 480 490 500 510 520
590 600 610 620 630 640
pF1KE2 MRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWV-PIL
..: .:::... : ::...:::.::: :.:. ........ :: . :: :..
CCDS83 VENALRVATINTVGDFMLFLGKVLIVCSTGLAGIMLLNYQ----QDYT-----VWVLPLI
530 540 550 560 570
650 660 670 680 690 700
pF1KE2 TVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKA
: . ..:.:: :.:.: : ::.::::: : . :::: : ..:...: ...... :
CCDS83 IVCLFAFLVAHCFLSIYEMVVDVLFLCFAIDTKYNDGSPGREFYMDKVLMEFVENSRKAM
580 590 600 610 620 630
pF1KE2 AES
:.
CCDS83 KEAGKGGVADSRELKPMLKKR
640 650
>>CCDS6763.1 SLC44A1 gene_id:23446|Hs108|chr9 (657 aa)
initn: 956 init1: 448 opt: 689 Z-score: 821.9 bits: 162.5 E(32554): 1.9e-39
Smith-Waterman score: 976; 28.8% identity (60.2% similar) in 699 aa overlap (25-706:20-636)
10 20 30 40 50 60
pF1KE2 MGDERPHYYGKHGTPQKYDPTFKGPIYNRGCTDIICCVFLLLAIVGYVAVGIIAWTHGDP
:. .:.:::: ....: .:. . .. . :
CCDS67 MGCCSSASSAAQSSKREWKPLEDRSCTDIPWLLLFILFCIGMGFICGFSIATGAA
10 20 30 40 50
70 80 90 100 110
pF1KE2 RKVIYPTDSRGEFCGQKGTKNENKP----------YLFYFNIVKCASPLVLLEFQCPTPQ
... :: :..::::.:: : : :.:... : : :.. . .
CCDS67 ARLVSGYDSYGNICGQKNTKLEAIPNSGMDHTQRKYVFFLD--PCN--LDLINRKIKSVA
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 ICVEKCPDRYLTYLNARSSRDFEYYKQFCVPGFKNNKGVAEVLRDGDCPAVLIPSK---P
.:: :: . : :. .. . .: ..: .. .. . :: . .:.. :
CCDS67 LCVAACPRQELKTLSDVQKFAEINGSALCSYNLKPSEYTTSPKSSVLCPKLPVPASAPIP
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 LARRCFPAIHAYKGVLMVGNETTYEDGHGSRKNITDLVEGAKKANGVLEARQLAMRIFED
. .:: : . .. . . .. . ..: . .::. ...
CCDS67 FFHRCAP--------VNISCYAKFAEALITF--VSDNSVLHRLISGVMTSKE--------
180 190 200 210
230 240 250 260 270 280
pF1KE2 YTVSWYWIIIGL-VIAMAMSLLFIILLRFLAGIMVWVMIIMVIL--VLGYGIFHCYMEYS
::.:: ......:.......:... ..::.. :.::: . : :.. . :.
CCDS67 -------IILGLCLLSLVLSMILMVIIRYISRVLVWILTILVILGSLGGTGVL--WWLYA
220 230 240 250 260
290 300 310 320 330 340
pF1KE2 RLRGEAGSDVSLVDLGFQTDFRVYLHLRQTWLAFMIILSILEVIIILLLIFLRKRILIAI
. : :. .: . : .:: . : . : ... ::..:... .:::. ..:
CCDS67 KQRRSPKETVTPEQLQIAED-----NLR-ALLIYAISATVFTVILFLIMLVMRKRVALTI
270 280 290 300 310
350 360 370 380 390 400
pF1KE2 ALIKEASRAVGYVMCSLLYPLVTFFLLCLCIAYWASTAVFLSTSNEAVYKIFDDSPCPFT
::.. :... .. .. :. ::: : : .:: : .::.:.. : . ... :
CCDS67 ALFHVAGKVFIHLPLLVFQPFWTFFALVLFWVYWIMTLLFLGTTGSPVQN--EQGFVEF-
320 330 340 350 360 370
410 420 430 440 450 460
pF1KE2 AKTCNPETFPSSNESRQCPNARCQFAFYGGESGYHRALLGLQIFNAFMFFWLANFVLALG
: .: :. .. :: ..:: .:...:.::
CCDS67 -KISGP----------------LQYMWW-----YH--VVGL--------IWISEFILACQ
380 390 400
470 480 490 500 510 520
pF1KE2 QVTLAGAFASYYWALRKPDDLPAFPLFSAFGRALRYHTGSLAFGALILAIVQIIRVILEY
:.:.::: ..::.. : .:: :.... .: .::: :..: :..:...:.: :.:: :
CCDS67 QMTVAGAVVTYYFT-RDKRNLPFTPILASVNRLIRYHLGTVAKGSFIITLVKIPRMILMY
410 420 430 440 450 460
530 540 550 560 570 580
pF1KE2 LDQRLKAAENKFAKCLMTCLKCCFWCLEKFIKFLNRNAYIMIAIYGTNFCTSARNAFFLL
. ..::. :: :.:.. ::.::::: ...::.::: :: .:::::::..:: .:
CCDS67 IHSQLKGKENACARCVLKSCICCLWCLEKCLNYLNQNAYTATAINSTNFCTSAKDAFVIL
470 480 490 500 510 520
590 600 610 620 630 640
pF1KE2 MRNIIRVAVLDKVTDFLFLLGKLLIVGSVGILAFFFFTHRIRIVQDTAPPLNYYWV-PIL
..: .:::... : ::...:::.::: :.:. ........ :: . :: :..
CCDS67 VENALRVATINTVGDFMLFLGKVLIVCSTGLAGIMLLNYQ----QDYT-----VWVLPLI
530 540 550 560 570
650 660 670 680 690 700
pF1KE2 TVIVGSYLIAHGFFSVYGMCVDTLFLCFLEDLERNDGSAERPYFMSSTLKKLLNKTNKKA
: . ..:.:: :.:.: : ::.::::: : . :::: : ..:...: ...... :
CCDS67 IVCLFAFLVAHCFLSIYEMVVDVLFLCFAIDTKYNDGSPGREFYMDKVLMEFVENSRKAM
580 590 600 610 620 630
pF1KE2 AES
:.
CCDS67 KEAGKGGVADSRELKPMASGASSA
640 650
706 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 17:01:35 2016 done: Tue Nov 8 17:01:36 2016
Total Scan time: 2.500 Total Display time: 0.160
Function used was FASTA [36.3.4 Apr, 2011]