FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2380, 629 aa
1>>>pF1KE2380 629 - 629 aa - 629 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3548+/-0.0012; mu= 18.7336+/- 0.072
mean_var=64.3969+/-13.357, 0's: 0 Z-trim(101.0): 41 B-trim: 8 in 1/46
Lambda= 0.159824
statistics sampled from 6295 (6323) to 6295 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.543), E-opt: 0.2 (0.194), width: 16
Scan time: 3.340
The best scores are: opt bits E(32554)
CCDS9333.1 SLC7A1 gene_id:6541|Hs108|chr13 ( 629) 4100 954.9 0
CCDS34852.1 SLC7A2 gene_id:6542|Hs108|chr8 ( 658) 2508 587.8 1.5e-167
CCDS55203.1 SLC7A2 gene_id:6542|Hs108|chr8 ( 698) 2508 587.8 1.6e-167
CCDS6002.2 SLC7A2 gene_id:6542|Hs108|chr8 ( 697) 2453 575.1 1e-163
CCDS14404.1 SLC7A3 gene_id:84889|Hs108|chrX ( 619) 1993 469.1 8e-132
CCDS33608.1 SLC7A4 gene_id:6545|Hs108|chr22 ( 635) 913 220.0 7.5e-57
CCDS33892.1 SLC7A14 gene_id:57709|Hs108|chr3 ( 771) 812 196.8 9.1e-50
>>CCDS9333.1 SLC7A1 gene_id:6541|Hs108|chr13 (629 aa)
initn: 4100 init1: 4100 opt: 4100 Z-score: 5105.6 bits: 954.9 E(32554): 0
Smith-Waterman score: 4100; 100.0% identity (100.0% similar) in 629 aa overlap (1-629:1-629)
10 20 30 40 50 60
pF1KE2 MGCKVLLNIGQQMLRRKVVDCSREETRLSRCLNTFDLVALGVGSTLGAGVYVLAGAVARE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 MGCKVLLNIGQQMLRRKVVDCSREETRLSRCLNTFDLVALGVGSTLGAGVYVLAGAVARE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 NAGPAIVISFLIAALASVLAGLCYGEFGARVPKTGSAYLYSYVTVGELWAFITGWNLILS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 NAGPAIVISFLIAALASVLAGLCYGEFGARVPKTGSAYLYSYVTVGELWAFITGWNLILS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 YIIGTSSVARAWSATFDELIGRPIGEFSRTHMTLNAPGVLAENPDIFAVIIILILTGLLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 YIIGTSSVARAWSATFDELIGRPIGEFSRTHMTLNAPGVLAENPDIFAVIIILILTGLLT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 LGVKESAMVNKIFTCINVLVLGFIMVSGFVKGSVKNWQLTEEDFGNTSGRLCLNNDTKEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 LGVKESAMVNKIFTCINVLVLGFIMVSGFVKGSVKNWQLTEEDFGNTSGRLCLNNDTKEG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 KPGVGGFMPFGFSGVLSGAATCFYAFVGFDCIATTGEEVKNPQKAIPVGIVASLLICFIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 KPGVGGFMPFGFSGVLSGAATCFYAFVGFDCIATTGEEVKNPQKAIPVGIVASLLICFIA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 YFGVSAALTLMMPYFCLDNNSPLPDAFKHVGWEGAKYAVAVGSLCALSASLLGSMFPMPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 YFGVSAALTLMMPYFCLDNNSPLPDAFKHVGWEGAKYAVAVGSLCALSASLLGSMFPMPR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 VIYAMAEDGLLFKFLANVNDRTKTPIIATLASGAVAAVMAFLFDLKDLVDLMSIGTLLAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 VIYAMAEDGLLFKFLANVNDRTKTPIIATLASGAVAAVMAFLFDLKDLVDLMSIGTLLAY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 SLVAACVLVLRYQPEQPNLVYQMASTSDELDPADQNELASTNDSQLGFLPEAEMFSLKTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 SLVAACVLVLRYQPEQPNLVYQMASTSDELDPADQNELASTNDSQLGFLPEAEMFSLKTI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 LSPKNMEPSKISGLIVNISTSLIAVLIITFCIVTVLGREALTKGALWAVFLLAGSALLCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 LSPKNMEPSKISGLIVNISTSLIAVLIITFCIVTVLGREALTKGALWAVFLLAGSALLCA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 VVTGVIWRQPESKTKLSFKVPFLPVLPILSIFVNVYLMMQLDQGTWVRFAVWMLIGFIIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS93 VVTGVIWRQPESKTKLSFKVPFLPVLPILSIFVNVYLMMQLDQGTWVRFAVWMLIGFIIY
550 560 570 580 590 600
610 620
pF1KE2 FGYGLWHSEEASLDADQARTPDGNLDQCK
:::::::::::::::::::::::::::::
CCDS93 FGYGLWHSEEASLDADQARTPDGNLDQCK
610 620
>>CCDS34852.1 SLC7A2 gene_id:6542|Hs108|chr8 (658 aa)
initn: 2023 init1: 1709 opt: 2508 Z-score: 3121.5 bits: 587.8 E(32554): 1.5e-167
Smith-Waterman score: 2508; 61.6% identity (84.9% similar) in 628 aa overlap (3-626:4-623)
10 20 30 40 50
pF1KE2 MGCKVLLNIGQQMLRRKVVDC-SREETRLSRCLNTFDLVALGVGSTLGAGVYVLAGAVA
:.. :.... ..:::.: : :.:.: :::.:.::.::::::::::::::::: ::
CCDS34 MIPCRAALTFARCLIRRKIVTLDSLEDTKLCRCLSTMDLIALGVGSTLGAGVYVLAGEVA
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 RENAGPAIVISFLIAALASVLAGLCYGEFGARVPKTGSAYLYSYVTVGELWAFITGWNLI
. ..::.::.::::::::::.:::::.:::::::::::::::.:::::::::::::::::
CCDS34 KADSGPSIVVSFLIAALASVMAGLCYAEFGARVPKTGSAYLYTYVTVGELWAFITGWNLI
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 LSYIIGTSSVARAWSATFDELIGRPIGEFSRTHMTLNAPGVLAENPDIFAVIIILILTGL
:::.:::::::::::.:::::... ::.: ::.. .: : ::: ::.::: .::.:.::
CCDS34 LSYVIGTSSVARAWSGTFDELLSKQIGQFLRTYFRMNYTG-LAEYPDFFAVCLILLLAGL
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 LTLGVKESAMVNKIFTCINVLVLGFIMVSGFVKGSVKNWQLTEEDFGNTSGRLCLNNDTK
:..:::::: :::.:: .:.::: :.::.:::::.: ::...:: . : :. . ..
CCDS34 LSFGVKESAWVNKVFTAVNILVLLFVMVAGFVKGNVANWKISEEFLKNISAS-AREPPSE
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 EGKP--GVGGFMPFGFSGVLSGAATCFYAFVGFDCIATTGEEVKNPQKAIPVGIVASLLI
.: :.:::::.::.:.:.::::::::::::::::::::::.:::::::.:::.:::.
CCDS34 NGTSIYGAGGFMPYGFTGTLAGAATCFYAFVGFDCIATTGEEVRNPQKAIPIGIVTSLLV
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 CFIAYFGVSAALTLMMPYFCLDNNSPLPDAFKHVGWEGAKYAVAVGSLCALSASLLGSMF
::.:::::::::::::::. ::..:::: ::..::: :::.::.:::::::.:::::.:
CCDS34 CFMAYFGVSAALTLMMPYYLLDEKSPLPVAFEYVGWGPAKYVVAAGSLCALSTSLLGSIF
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 PMPRVIYAMAEDGLLFKFLANVNDRTKTPIIATLASGAVAAVMAFLFDLKDLVDLMSIGT
::::::::::::::::: ::..:..:::::::::.::::::.:::::::: :::.:::::
CCDS34 PMPRVIYAMAEDGLLFKCLAQINSKTKTPIIATLSSGAVAALMAFLFDLKALVDMMSIGT
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 LLAYSLVAACVLVLRYQPEQPNLVYQMASTSDELDPADQN-ELASTNDSQLGFLPEAEMF
:.::::::::::.::: ::.: :.. . : : : .. ...: ..::. .: . . :
CCDS34 LMAYSLVAACVLILRY---QPGLSYDQPKCSPEKDGLGSSPRVTSKSESQVTML-QRQGF
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 SLKTILSPKNMEPSKISGLIVNISTSLIAVLIITFCIVTVLGREALTKGALWAVFLLAGS
:..:.. : .. :.. :. .:.. ....: :.. . ..:. : .:.:. :.. :::
CCDS34 SMRTLFCP-SLLPTQQSASLVSFLVGFLAFLVLGLSVLTTYGVHAITRLEAWSLALLALF
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 ALLCAVVTGVIWRQPESKTKLSFKVPFLPVLPILSIFVNVYLMMQLDQGTWVRFAVWMLI
.: .... .:::::... :..: ::::: :: .::.::.:::.::. :::::..:: :
CCDS34 LVLFVAIVLTIWRQPQNQQKVAFMVPFLPFLPAFSILVNIYLMVQLSADTWVRFSIWMAI
540 550 560 570 580 590
600 610 620
pF1KE2 GFIIYFGYGLWHSEEASLDADQARTPDGNLDQCK
::.:::.::. :: :. : :. :. :
CCDS34 GFLIYFSYGIRHSLEGHLR-DENNEEDAYPDNVHAAAEEKSAIQANDHHPRNLSSPFIFH
600 610 620 630 640 650
CCDS34 EKTSEF
>>CCDS55203.1 SLC7A2 gene_id:6542|Hs108|chr8 (698 aa)
initn: 2023 init1: 1709 opt: 2508 Z-score: 3121.1 bits: 587.8 E(32554): 1.6e-167
Smith-Waterman score: 2508; 61.6% identity (84.9% similar) in 628 aa overlap (3-626:44-663)
10 20 30
pF1KE2 MGCKVLLNIGQQMLRRKVVDC-SREETRLSRC
:.. :.... ..:::.: : :.:.: ::
CCDS55 ICRGFIGTPAPPVCDSKFLLSPSSDVRMIPCRAALTFARCLIRRKIVTLDSLEDTKLCRC
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE2 LNTFDLVALGVGSTLGAGVYVLAGAVARENAGPAIVISFLIAALASVLAGLCYGEFGARV
:.:.::.::::::::::::::::: ::. ..::.::.::::::::::.:::::.::::::
CCDS55 LSTMDLIALGVGSTLGAGVYVLAGEVAKADSGPSIVVSFLIAALASVMAGLCYAEFGARV
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE2 PKTGSAYLYSYVTVGELWAFITGWNLILSYIIGTSSVARAWSATFDELIGRPIGEFSRTH
:::::::::.::::::::::::::::::::.:::::::::::.:::::... ::.: ::.
CCDS55 PKTGSAYLYTYVTVGELWAFITGWNLILSYVIGTSSVARAWSGTFDELLSKQIGQFLRTY
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE2 MTLNAPGVLAENPDIFAVIIILILTGLLTLGVKESAMVNKIFTCINVLVLGFIMVSGFVK
. .: : ::: ::.::: .::.:.:::..:::::: :::.:: .:.::: :.::.::::
CCDS55 FRMNYTG-LAEYPDFFAVCLILLLAGLLSFGVKESAWVNKVFTAVNILVLLFVMVAGFVK
200 210 220 230 240 250
220 230 240 250 260
pF1KE2 GSVKNWQLTEEDFGNTSGRLCLNNDTKEGKP--GVGGFMPFGFSGVLSGAATCFYAFVGF
:.: ::...:: . : :. . ...: :.:::::.::.:.:.::::::::::::
CCDS55 GNVANWKISEEFLKNISAS-AREPPSENGTSIYGAGGFMPYGFTGTLAGAATCFYAFVGF
260 270 280 290 300 310
270 280 290 300 310 320
pF1KE2 DCIATTGEEVKNPQKAIPVGIVASLLICFIAYFGVSAALTLMMPYFCLDNNSPLPDAFKH
::::::::::.:::::::.:::.:::.::.:::::::::::::::. ::..:::: ::..
CCDS55 DCIATTGEEVRNPQKAIPIGIVTSLLVCFMAYFGVSAALTLMMPYYLLDEKSPLPVAFEY
320 330 340 350 360 370
330 340 350 360 370 380
pF1KE2 VGWEGAKYAVAVGSLCALSASLLGSMFPMPRVIYAMAEDGLLFKFLANVNDRTKTPIIAT
::: :::.::.:::::::.:::::.:::::::::::::::::: ::..:..::::::::
CCDS55 VGWGPAKYVVAAGSLCALSTSLLGSIFPMPRVIYAMAEDGLLFKCLAQINSKTKTPIIAT
380 390 400 410 420 430
390 400 410 420 430 440
pF1KE2 LASGAVAAVMAFLFDLKDLVDLMSIGTLLAYSLVAACVLVLRYQPEQPNLVYQMASTSDE
:.::::::.:::::::: :::.::::::.::::::::::.::: ::.: :.. . : :
CCDS55 LSSGAVAALMAFLFDLKALVDMMSIGTLMAYSLVAACVLILRY---QPGLSYDQPKCSPE
440 450 460 470 480
450 460 470 480 490 500
pF1KE2 LDPADQN-ELASTNDSQLGFLPEAEMFSLKTILSPKNMEPSKISGLIVNISTSLIAVLII
: .. ...: ..::. .: . . ::..:.. : .. :.. :. .:.. ....: :..
CCDS55 KDGLGSSPRVTSKSESQVTML-QRQGFSMRTLFCP-SLLPTQQSASLVSFLVGFLAFLVL
490 500 510 520 530 540
510 520 530 540 550 560
pF1KE2 TFCIVTVLGREALTKGALWAVFLLAGSALLCAVVTGVIWRQPESKTKLSFKVPFLPVLPI
. ..:. : .:.:. :.. ::: .: .... .:::::... :..: ::::: ::
CCDS55 GLSVLTTYGVHAITRLEAWSLALLALFLVLFVAIVLTIWRQPQNQQKVAFMVPFLPFLPA
550 560 570 580 590 600
570 580 590 600 610 620
pF1KE2 LSIFVNVYLMMQLDQGTWVRFAVWMLIGFIIYFGYGLWHSEEASLDADQARTPDGNLDQC
.::.::.:::.::. :::::..:: :::.:::.::. :: :. : :. :. :
CCDS55 FSILVNIYLMVQLSADTWVRFSIWMAIGFLIYFSYGIRHSLEGHLR-DENNEEDAYPDNV
610 620 630 640 650 660
pF1KE2 K
CCDS55 HAAAEEKSAIQANDHHPRNLSSPFIFHEKTSEF
670 680 690
>>CCDS6002.2 SLC7A2 gene_id:6542|Hs108|chr8 (697 aa)
initn: 1747 init1: 1403 opt: 2453 Z-score: 3052.5 bits: 575.1 E(32554): 1e-163
Smith-Waterman score: 2453; 59.7% identity (84.4% similar) in 628 aa overlap (3-626:44-662)
10 20 30
pF1KE2 MGCKVLLNIGQQMLRRKVVDC-SREETRLSRC
:.. :.... ..:::.: : :.:.: ::
CCDS60 ICRGFIGTPAPPVCDSKFLLSPSSDVRMIPCRAALTFARCLIRRKIVTLDSLEDTKLCRC
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE2 LNTFDLVALGVGSTLGAGVYVLAGAVARENAGPAIVISFLIAALASVLAGLCYGEFGARV
:.:.::.::::::::::::::::: ::. ..::.::.::::::::::.:::::.::::::
CCDS60 LSTMDLIALGVGSTLGAGVYVLAGEVAKADSGPSIVVSFLIAALASVMAGLCYAEFGARV
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE2 PKTGSAYLYSYVTVGELWAFITGWNLILSYIIGTSSVARAWSATFDELIGRPIGEFSRTH
:::::::::.::::::::::::::::::::.:::::::::::.:::::... ::.: ::.
CCDS60 PKTGSAYLYTYVTVGELWAFITGWNLILSYVIGTSSVARAWSGTFDELLSKQIGQFLRTY
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE2 MTLNAPGVLAENPDIFAVIIILILTGLLTLGVKESAMVNKIFTCINVLVLGFIMVSGFVK
. .: : ::: ::.::: .::.:.:::..:::::: :::.:: .:.::: :.::.::::
CCDS60 FRMNYTG-LAEYPDFFAVCLILLLAGLLSFGVKESAWVNKVFTAVNILVLLFVMVAGFVK
200 210 220 230 240 250
220 230 240 250 260
pF1KE2 GSVKNWQLTEEDFGNTSGRLCLNNDTKEGKP--GVGGFMPFGFSGVLSGAATCFYAFVGF
:.: ::...:: . : :. . ...: :.:::::.::.:.:.::::::::::::
CCDS60 GNVANWKISEEFLKNISAS-AREPPSENGTSIYGAGGFMPYGFTGTLAGAATCFYAFVGF
260 270 280 290 300 310
270 280 290 300 310 320
pF1KE2 DCIATTGEEVKNPQKAIPVGIVASLLICFIAYFGVSAALTLMMPYFCLDNNSPLPDAFKH
::::::::::.:::::::.:::.:::.::.:::::::::::::::. ::..:::: ::..
CCDS60 DCIATTGEEVRNPQKAIPIGIVTSLLVCFMAYFGVSAALTLMMPYYLLDEKSPLPVAFEY
320 330 340 350 360 370
330 340 350 360 370 380
pF1KE2 VGWEGAKYAVAVGSLCALSASLLGSMFPMPRVIYAMAEDGLLFKFLANVNDRTKTPIIAT
::: :::.::.:::::::.::::::::.::...:::.:::::.::: :. : ..:. ::
CCDS60 VGWGPAKYVVAAGSLCALSTSLLGSMFPLPRILFAMARDGLLFRFLARVSKR-QSPVAAT
380 390 400 410 420 430
390 400 410 420 430 440
pF1KE2 LASGAVAAVMAFLFDLKDLVDLMSIGTLLAYSLVAACVLVLRYQPEQPNLVYQMASTSDE
:..:...:.:::::::: :::.::::::.::::::::::.::: ::.: :.. . : :
CCDS60 LTAGVISALMAFLFDLKALVDMMSIGTLMAYSLVAACVLILRY---QPGLSYDQPKCSPE
440 450 460 470 480
450 460 470 480 490 500
pF1KE2 LDPADQN-ELASTNDSQLGFLPEAEMFSLKTILSPKNMEPSKISGLIVNISTSLIAVLII
: .. ...: ..::. .: . . ::..:.. : .. :.. :. .:.. ....: :..
CCDS60 KDGLGSSPRVTSKSESQVTML-QRQGFSMRTLFCP-SLLPTQQSASLVSFLVGFLAFLVL
490 500 510 520 530 540
510 520 530 540 550 560
pF1KE2 TFCIVTVLGREALTKGALWAVFLLAGSALLCAVVTGVIWRQPESKTKLSFKVPFLPVLPI
. ..:. : .:.:. :.. ::: .: .... .:::::... :..: ::::: ::
CCDS60 GLSVLTTYGVHAITRLEAWSLALLALFLVLFVAIVLTIWRQPQNQQKVAFMVPFLPFLPA
550 560 570 580 590 600
570 580 590 600 610 620
pF1KE2 LSIFVNVYLMMQLDQGTWVRFAVWMLIGFIIYFGYGLWHSEEASLDADQARTPDGNLDQC
.::.::.:::.::. :::::..:: :::.:::.::. :: :. : :. :. :
CCDS60 FSILVNIYLMVQLSADTWVRFSIWMAIGFLIYFSYGIRHSLEGHLR-DENNEEDAYPDNV
610 620 630 640 650 660
pF1KE2 K
CCDS60 HAAAEEKSAIQANDHHPRNLSSPFIFHEKTSEF
670 680 690
>>CCDS14404.1 SLC7A3 gene_id:84889|Hs108|chrX (619 aa)
initn: 2405 init1: 1009 opt: 1993 Z-score: 2480.1 bits: 469.1 E(32554): 8e-132
Smith-Waterman score: 2418; 60.5% identity (82.0% similar) in 622 aa overlap (10-626:10-610)
10 20 30 40 50 60
pF1KE2 MGCKVLLNIGQQMLRRKVVDCSREETRLSRCLNTFDLVALGVGSTLGAGVYVLAGAVARE
::...::.... . ::::.:::.:.:::::::::::::::::::: ::..
CCDS14 MPWQAFRRFGQKLVRRRTLESGMAETRLARCLSTLDLVALGVGSTLGAGVYVLAGEVAKD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 NAGPAIVISFLIAALASVLAGLCYGEFGARVPKTGSAYLYSYVTVGELWAFITGWNLILS
.:::.::: ::.:::.::::::::.:::::::..::::::::::::::::: ::::::::
CCDS14 KAGPSIVICFLVAALSSVLAGLCYAEFGARVPRSGSAYLYSYVTVGELWAFTTGWNLILS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 YIIGTSSVARAWSATFDELIGRPIGEFSRTHMTLNAPGVLAENPDIFAVIIILILTGLLT
:.:::.:::::::..::.::: :.. . ..:..: :::: ::.::. ..:.:::::.
CCDS14 YVIGTASVARAWSSAFDNLIGNHISKTLQGSIALHVPHVLAEYPDFFALGLVLLLTGLLA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 LGVKESAMVNKIFTCINVLVLGFIMVSGFVKGSVKNWQLTEEDFGNTSGRLCLNNDTKEG
::..:::.:.:.:: .:.:::::.:.::::::.:.::.:::::. . ..: :::
CCDS14 LGASESALVTKVFTGVNLLVLGFVMISGFVKGDVHNWKLTEEDYELAMAEL---NDTYSL
190 200 210 220 230
250 260 270 280 290
pF1KE2 KP-GVGGFMPFGFSGVLSGAATCFYAFVGFDCIATTGEEVKNPQKAIPVGIVASLLICFI
: : :::.:::: :.: :::::::::::::::::::::..:::..::.::: :: .::.
CCDS14 GPLGSGGFVPFGFEGILRGAATCFYAFVGFDCIATTGEEAQNPQRSIPMGIVISLSVCFL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 AYFGVSAALTLMMPYFCLDNNSPLPDAFKHVGWEGAKYAVAVGSLCALSASLLGSMFPMP
:::.::.::::::::. :. .::::.:: ..:: :.:.::::::::::.::::::::::
CCDS14 AYFAVSSALTLMMPYYQLQPESPLPEAFLYIGWAPARYVVAVGSLCALSTSLLGSMFPMP
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 RVIYAMAEDGLLFKFLANVNDRTKTPIIATLASGAVAAVMAFLFDLKDLVDLMSIGTLLA
:::::::::::::. :: .. :.::::::..:: .:: ::::: : :::::::::::::
CCDS14 RVIYAMAEDGLLFRVLARIHTGTRTPIIATVVSGIIAAFMAFLFKLTDLVDLMSIGTLLA
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 YSLVAACVLVLRYQPEQPNLVYQMASTSDELDPADQNELASTNDSQLGFLPEAEMFSLKT
::::. :::.:::::.: . .:..:.. :.: .: :.: ..:
CCDS14 YSLVSICVLILRYQPDQET------KTGEEVE--LQEEAITT---------ESEKLTLWG
420 430 440 450 460
480 490 500 510 520 530
pF1KE2 ILSPKNMEPSKISGLIVNISTSLIAVLIITFCIVTVLGREALTKGAL-WAVFLLAGSALL
.. : : :. .:: :: . .::.:::. ..:.: . : .: : :.. .. :.
CCDS14 LFFPLNSIPTPLSGQIVYVCSSLLAVLLTALCLVLAQWSVPLLSGDLLWTAVVVLLLLLI
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE2 CAVVTGVIWRQPESKTKLSFKVPFLPVLPILSIFVNVYLMMQLDQGTWVRFAVWMLIGFI
.... ::::::.:.: : :::: ::.::..:::::.:::::. :::.::.:::::::
CCDS14 IGIIV-VIWRQPQSSTPLHFKVPALPLLPLMSIFVNIYLMMQMTAGTWARFGVWMLIGFA
530 540 550 560 570
600 610 620
pF1KE2 IYFGYGLWHSEE---ASLDADQARTPDGNLDQCK
::::::. :: : .. . ..:. .::
CCDS14 IYFGYGIQHSLEEIKSNQPSRKSRAKTVDLDPGTLYVHSV
580 590 600 610
>>CCDS33608.1 SLC7A4 gene_id:6545|Hs108|chr22 (635 aa)
initn: 1540 init1: 854 opt: 913 Z-score: 1134.1 bits: 220.0 E(32554): 7.5e-57
Smith-Waterman score: 1554; 42.0% identity (73.1% similar) in 614 aa overlap (6-610:11-592)
10 20 30 40 50
pF1KE2 MGCKVLLNIGQQMLRRKVVDCSREETRLSRCLNTFDLVALGVGSTLGAGVYVLAG
: . :.. : : .. : :: : :::.:.::. ::::. .:.:.:::.:
CCDS33 MARGLPTIASLARLCQKLNRLKPLEDSTMETSLRRCLSTLDLTLLGVGGMVGSGLYVLTG
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 AVARENAGPAIVISFLIAALASVLAGLCYGEFGARVPKTGSAYLYSYVTVGELWAFITGW
:::.: ::::...:: .::.::.::.:::.:::::::.::::::..::..::::::. ::
CCDS33 AVAKEVAGPAVLLSFGVAAVASLLAALCYAEFGARVPRTGSAYLFTYVSMGELWAFLIGW
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 NLILSYIIGTSSVARAWSATFDELIGRPIGEFSRTHM-TLNAPGVLAENPDIFAVIIILI
:..: :::: ..::::::. .: .... : .:..::. . ..: .:.. ::..:. :::.
CCDS33 NVLLEYIIGGAAVARAWSGYLDSMFSHSIRNFTETHVGSWQVP-LLGHYPDFLAAGIILL
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 LTGLLTLGVKESAMVNKIFTCINVLVLGFIMVSGFVKGSVKNWQLTEEDFGNTSGRLCLN
..... :.. :. .:. :. :..::. ::.. ::. .. .::. :
CCDS33 ASAFVSCGARVSSWLNHTFSAISLLVILFIVILGFILAQPHNWSADE-------------
180 190 200 210 220
240 250 260 270 280 290
pF1KE2 NDTKEGKPGVGGFMPFGFSGVLSGAATCFYAFVGFDCIATTGEEVKNPQKAIPVGIVASL
::: :::::::..:.:.::::::::: ::...::..::....:..:. ::
CCDS33 ----------GGFAPFGFSGVMAGTASCFYAFVGFDVIAASSEEAQNPRRSVPLAIAISL
230 240 250 260 270
300 310 320 330 340 350
pF1KE2 LICFIAYFGVSAALTLMMPYFCLDNNSPLPDAFKHVGWEGAKYAVAVGSLCALSASLLGS
: ::. ::..::::.:. :: .: : ::: . :.. : . ::.::.::... ::.
CCDS33 AIAAGAYILVSTVLTLMVPWHSLDPDSALADAFYQRGYRWAGFIVAAGSICAMNTVLLSL
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE2 MFPMPRVIYAMAEDGLLFKFLANVNDRTKTPIIATLASGAVAAVMAFLFDLKDLVDLMSI
.: .::..:::: :::.:. .:.:. ::..:. .::: : ..: .:.:.::..::...:.
CCDS33 LFSLPRIVYAMAADGLFFQVFAHVHPRTQVPVAGTLAFGLLTAFLALLLDLESLVQFLSL
340 350 360 370 380 390
420 430 440 450 460 470
pF1KE2 GTLLAYSLVAACVLVLRYQ----PEQPNLVYQMASTSDELDPADQNELASTNDSQLGFLP
::::::..::. ..:::.: : .:. . :... . .:. .:..: ... :
CCDS33 GTLLAYTFVATSIIVLRFQKSSPPSSPGPASPGPLTKQQSSFSDHLQLVGTVHASV---P
400 410 420 430 440 450
480 490 500 510 520
pF1KE2 EAEMFSLKTILSPK-NMEPSKISGLIVNISTSLIAVLIITFCIVTVLGREALTK---GAL
: :: : : .. . : .:. . ... . ::. : :.: .: : .
CCDS33 EPG--ELKPALRPYLGFLDGYSPGAVVTWALGVMLASAITIGCVLVFGNSTLHLPHWGYI
460 470 480 490 500 510
530 540 550 560 570 580
pF1KE2 WAVFLLAGSALLCAVVTGVIWRQPESKTKLSFKVPFLPVLPILSIFVNVYLMMQLDQGTW
..: . :: .: :. .: . . : :..:..:..: ::: .:. ::..:. ::
CCDS33 LLLLLTSVMFLLSLLVLGA--HQQQYREDL-FQIPMVPLIPALSIVLNICLMLKLSYLTW
520 530 540 550 560
590 600 610 620
pF1KE2 VRFAVWMLIGFIIYFGYGLWHSEEASLDADQARTPDGNLDQCK
:::..:.:.:. .:::::. ::.:
CCDS33 VRFSIWLLMGLAVYFGYGIRHSKENQRELPGLNSTHYVVFPRGSLEETVQAMQPPSQAPA
570 580 590 600 610 620
>>CCDS33892.1 SLC7A14 gene_id:57709|Hs108|chr3 (771 aa)
initn: 1705 init1: 812 opt: 812 Z-score: 1006.9 bits: 196.8 E(32554): 9.1e-50
Smith-Waterman score: 1500; 42.4% identity (69.1% similar) in 641 aa overlap (26-591:47-660)
10 20 30 40 50
pF1KE2 MGCKVLLNIGQQMLRRKVVDCSREETRLSRCLNTFDLVALGVGSTLGAGVYVLAG
:.:.. :.: ::..::::: .:.:.::..:
CCDS33 AAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLISLGVGSCVGTGMYVVSG
20 30 40 50 60 70
60 70 80 90 100 110
pF1KE2 AVARENAGPAIVISFLIAALASVLAGLCYGEFGARVPKT-GSAYLYSYVTVGELWAFITG
::.: :::....::.:::.::.:.:.::.:::.::::: :::: ::::::::. ::. :
CCDS33 LVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSAYTYSYVTVGEFVAFFIG
80 90 100 110 120 130
120 130 140 150 160 170
pF1KE2 WNLILSYIIGTSSVARAWSATFDELIGRPIGEFSRTHM-TLNAPGVLAEN-PDIFAVIII
::::: :.:::.. : : :. :: : .. :... . :::. : :. ::..:..:
CCDS33 WNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGLGKGEESYPDLLALLIA
140 150 160 170 180 190
180 190 200 210 220 230
pF1KE2 LILTGLLTLGVKESAMVNKIFTCINVLVLGFIMVSG--FVKGSVKNWQLTEEDFGNTSGR
.:.: ...::::.: :.... .:. : :::..: :..: : :
CCDS33 VIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFING--KYW-------------
200 210 220 230 240
240 250 260 270 280 290
pF1KE2 LCLNNDTKEGKPGVGGFMPFGFSGVLSGAATCFYAFVGFDCIATTGEEVKNPQKAIPVGI
::. :.: :.::::.:::::::::.::: :::::::.:::. .:: .:
CCDS33 -------AEGQ-----FLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAI
250 260 270 280
300 310 320 330 340 350
pF1KE2 VASLLICFIAYFGVSAALTLMMPYFCLDNNSPLPDAFKHVGWEGAKYAVAVGSLCALSAS
.:::.::. :: .::. ::::.::. .:..::: . : :. .::..::.::. .:..:
CCDS33 TASLVICLTAYVSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVS
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE2 LLGSMFPMPRVIYAMAEDGLLFKFLANVNDRTKTPIIATLASGAVAAVMAFLFDLKDLVD
::::.::::::::::: :::::.:::.:.. :.::..: ..:: .::..:.: .:.::..
CCDS33 LLGSLFPMPRVIYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIE
350 360 370 380 390 400
420 430 440
pF1KE2 LMSIGTLLAYSLVAACVLVLRYQPEQP--NLVYQMA----------------------ST
.:::::::::.::..:::.::::::. ..: .. :
CCDS33 MMSIGTLLAYTLVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSE
410 420 430 440 450 460
450 460 470
pF1KE2 SDELD-PADQN----ELASTNDSQL-----------------GFLP-----EAE------
.::.. :: .. .: : .:... : . ::.
CCDS33 GDEFSGPATNTCGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIY
470 480 490 500 510 520
480 490 500 510 520
pF1KE2 MFSLKTILSP-------------KNMEPSKISGLIVNISTSLIAVLIITFCIVTVLGREA
...:: ...: : .:. .: :.: . :. .:.. :: ..: .
CCDS33 LIKLKKLIGPHYYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFIIFGSDY
530 540 550 560 570 580
530 540 550 560 570 580
pF1KE2 LTKGALWAVFLLAGSALLCAVVTGVIWRQPESKTKLSFKVPFLPVLPILSIFVNVYLMMQ
... . ::..:.. .:: .... :: .:::. :: . .: :: .: ....::.:::..
CCDS33 ISEQSWWAILLVVLMVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLK
590 600 610 620 630 640
590 600 610 620
pF1KE2 LDQGTWVRFAVWMLIGFIIYFGYGLWHSEEASLDADQARTPDGNLDQCK
:. ::.::::
CCDS33 LSTITWIRFAVWCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFS
650 660 670 680 690 700
629 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 14:39:12 2016 done: Sun Nov 6 14:39:12 2016
Total Scan time: 3.340 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]