FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6407, 496 aa
1>>>pF1KE6407 496 - 496 aa - 496 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.7889+/-0.00103; mu= 21.0383+/- 0.062
mean_var=65.6951+/-13.487, 0's: 0 Z-trim(102.3): 33 B-trim: 0 in 0/51
Lambda= 0.158237
statistics sampled from 6883 (6894) to 6883 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.572), E-opt: 0.2 (0.212), width: 16
Scan time: 1.980
The best scores are: opt bits E(32554)
CCDS2468.1 SLC19A3 gene_id:80704|Hs108|chr2 ( 496) 3226 745.8 2.4e-215
CCDS1280.1 SLC19A2 gene_id:10560|Hs108|chr1 ( 497) 1607 376.3 4.4e-104
CCDS81398.1 SLC19A2 gene_id:10560|Hs108|chr1 ( 296) 767 184.3 1.6e-46
CCDS56218.1 SLC19A1 gene_id:6573|Hs108|chr21 ( 489) 682 165.1 1.6e-40
CCDS13725.1 SLC19A1 gene_id:6573|Hs108|chr21 ( 591) 682 165.1 1.8e-40
CCDS56217.1 SLC19A1 gene_id:6573|Hs108|chr21 ( 551) 555 136.1 9.3e-32
>>CCDS2468.1 SLC19A3 gene_id:80704|Hs108|chr2 (496 aa)
initn: 3226 init1: 3226 opt: 3226 Z-score: 3979.6 bits: 745.8 E(32554): 2.4e-215
Smith-Waterman score: 3226; 100.0% identity (100.0% similar) in 496 aa overlap (1-496:1-496)
10 20 30 40 50 60
pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLTSAEITNEIFPVWT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLTSAEITNEIFPVWT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 YSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQVVEFFYGMVTAAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 YSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQVVEFFYGMVTAAE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 VAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANMSYFYLNVISLASV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 VAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANMSYFYLNVISLASV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 SVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPGCEEQKPTSEILST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 SVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPGCEEQKPTSEILST
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 SGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAFATAGFNQVLNYVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 SGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAFATAGFNQVLNYVQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 ILWDYKAPSQDSSIYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGELALVVFSVVNAGSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 ILWDYKAPSQDSSIYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGELALVVFSVVNAGSL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 FLMHYTANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERYALVFGINTFIALVIQTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 FLMHYTANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERYALVFGINTFIALVIQTI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 MTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMYITYSTKSQKDVQSPAPSENPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 MTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMYITYSTKSQKDVQSPAPSENPD
430 440 450 460 470 480
490
pF1KE6 VSHPEEESNIIMSTKL
::::::::::::::::
CCDS24 VSHPEEESNIIMSTKL
490
>>CCDS1280.1 SLC19A2 gene_id:10560|Hs108|chr1 (497 aa)
initn: 1612 init1: 879 opt: 1607 Z-score: 1982.1 bits: 376.3 E(32554): 4.4e-104
Smith-Waterman score: 1607; 52.1% identity (79.4% similar) in 466 aa overlap (12-472:30-490)
10 20 30 40
pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGP
:. ::..:: .:::. .::::::: ::: ::
CCDS12 MDVPGPVSRRAAAAAATVLLRTARVRRECWFLPTALLCAYGFFASLRPSEPFLTPYLLGP
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE6 DKNLTSAEITNEIFPVWTYSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQG
::::: :. :::.:::::::::::.:::. :::.:::::..:::.:.:.::..::..::
CCDS12 DKNLTEREVFNEIYPVWTYSYLVLLFPVFLATDYLRYKPVVLLQGLSLIVTWFMLLYAQG
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 VKTMQVVEFFYGMVTAAEVAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLV
. ..: .:::::..::.:.:::.::::::. ::.:..::::.::...:.::::.:.::
CCDS12 LLAIQFLEFFYGIATATEIAYYSYIYSVVDLGMYQKVTSYCRSATLVGFTVGSVLGQILV
130 140 150 160 170 180
170 180 190 200 210
pF1KE6 SLANMSYFYLNVISLASVSVAFLFSLFLPMPKKSMFFHAKPSREIK----KSSSVNPVLE
:.:. : : ::::::. ::::: . :::::.::.::: :: . : .. . : .
CCDS12 SVAGWSLFSLNVISLTCVSVAFAVAWFLPMPQKSLFFHHIPSTCQRVNGIKVQNGGIVTD
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE6 ETHEGEAPGCEEQKPTSEILSTSGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRL
.. :: :. . . ... . ::. . : . : : .:. ::::. :
CCDS12 TPASNHLPGWEDIESKIPLNMEEPPVEEPE---PKPDRLLV-LKVLW-NDFLMCYSSRPL
250 260 270 280 290
280 290 300 310 320 330
pF1KE6 FYWSLWWAFATAGFNQVLNYVQILWDYKAPSQDSSIYNGAVEAIATFGGAVAAFAVGYVK
. ::.:::..: :. ::.::.: ::. ::. ..::::.:::..:. ::::.:::::.:
CCDS12 LCWSVWWALSTCGYFQVVNYTQGLWEKVMPSRYAAIYNGGVEAVSTLLGAVAVFAVGYIK
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE6 VNWDLLGELALVVFSVVNAGSLFLMHYTANIWACYAGYLIFKSSYMLLITIAVFQIAVNL
..:. ::..: .::.. :.....: ..:::.:::.:..:. ::::::::.::::.::
CCDS12 ISWSTWGEMTLSLFSLLIAAAVYIMDTVGNIWVCYASYVVFRIIYMLLITIATFQIAANL
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE6 NVERYALVFGINTFIALVIQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMR-S
..::::::::.::::::..::..:.:::: ::.: .. :::.:.::::.:: .:: .
CCDS12 SMERYALVFGVNTFIALALQTLLTLIVVDASGLGLEITTQFLIYASYFALIAVVFLASGA
420 430 440 450 460 470
460 470 480 490
pF1KE6 MYITYSTKSQKDVQSPAPSENPDVSHPEEESNIIMSTKL
. . . .. .: ::
CCDS12 VSVMKKCRKLEDPQSSSQVTTS
480 490
>>CCDS81398.1 SLC19A2 gene_id:10560|Hs108|chr1 (296 aa)
initn: 918 init1: 747 opt: 767 Z-score: 948.8 bits: 184.3 E(32554): 1.6e-46
Smith-Waterman score: 767; 51.6% identity (81.9% similar) in 221 aa overlap (253-472:71-289)
230 240 250 260 270 280
pF1KE6 GEAPGCEEQKPTSEILSTSGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWS
::. . : . : : .:. ::::. :. ::
CCDS81 GFFASLRPSEPFLTPYLLGPDKNLTEREEPKPDRLLV-LKVLW-NDFLMCYSSRPLLCWS
50 60 70 80 90
290 300 310 320 330 340
pF1KE6 LWWAFATAGFNQVLNYVQILWDYKAPSQDSSIYNGAVEAIATFGGAVAAFAVGYVKVNWD
.:::..: :. ::.::.: ::. ::. ..::::.:::..:. ::::.:::::.:..:.
CCDS81 VWWALSTCGYFQVVNYTQGLWEKVMPSRYAAIYNGGVEAVSTLLGAVAVFAVGYIKISWS
100 110 120 130 140 150
350 360 370 380 390 400
pF1KE6 LLGELALVVFSVVNAGSLFLMHYTANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVER
::..: .::.. :.....: ..:::.:::.:..:. ::::::::.::::.::..::
CCDS81 TWGEMTLSLFSLLIAAAVYIMDTVGNIWVCYASYVVFRIIYMLLITIATFQIAANLSMER
160 170 180 190 200 210
410 420 430 440 450 460
pF1KE6 YALVFGINTFIALVIQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMR-SMYIT
::::::.::::::..::..:.:::: ::.: .. :::.:.::::.:: .:: .. .
CCDS81 YALVFGVNTFIALALQTLLTLIVVDASGLGLEITTQFLIYASYFALIAVVFLASGAVSVM
220 230 240 250 260 270
470 480 490
pF1KE6 YSTKSQKDVQSPAPSENPDVSHPEEESNIIMSTKL
. .. .: ::
CCDS81 KKCRKLEDPQSSSQVTTS
280 290
>>CCDS56218.1 SLC19A1 gene_id:6573|Hs108|chr21 (489 aa)
initn: 1172 init1: 679 opt: 682 Z-score: 841.0 bits: 165.1 E(32554): 1.6e-40
Smith-Waterman score: 1159; 43.1% identity (73.1% similar) in 432 aa overlap (11-438:24-431)
10 20 30 40
pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLT
:: . . ::..::....::.: :. ::: :::::.:
CCDS56 MVPSSPAVEKQVPVEPGPDPELRSWRHLVCYLCFYGFMAQIRPGESFITPYLLGPDKNFT
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE6 SAEITNEIFPVWTYSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQ
..:::: :: .::::..:.:::.::::.:: ::..:::.::. .:::::.:..: ::
CCDS56 REQVTNEITPVLSYSYLAVLVPVFLLTDYLRYTPVLLLQGLSFVSVWLLLLLGHSVAHMQ
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 VVEFFYGMVTAAEVAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANM
..:.::... ::..:: .::.:.: : .::::.:: :...: . ..:::.::::... .
CCDS56 LMELFYSVTMAARIAYSSYIFSLVRPARYQRVAGYSRAAVLLGVFTSSVLGQLLVTVGRV
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE6 SYFYLNVISLASVSVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPG
:. :: :::: .. . ...::: ::.:.::. . . :.: ::. . : ::
CCDS56 SFSTLNYISLAFLTFSVVLALFLKRPKRSLFFNRDDRGRCETSASE---LERMNPG--PG
190 200 210 220 230
230 240 250 260 270 280
pF1KE6 CEEQKPTSEILSTSGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAF
:::... . : :... ...: . .: :::::.:
CCDS56 --------------GKLGHALRVACGDS-----VLARMLRELGDSLRRPQLRLWSLWWVF
240 250 260 270
290 300 310 320 330 340
pF1KE6 ATAGFNQVLNYVQILWDYKAPSQDSS-IYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGE
.::. :. ::.:::. :. .:. .::::..: .:. ::...::.:.::. : ..
CCDS56 NSAGYYLVVYYVHILWNEVDPTTNSARVYNGAADAASTLLGAITSFAAGFVKIRWARWSK
280 290 300 310 320 330
350 360 370 380 390 400
pF1KE6 LALVVFSVVNAGSLFLMHYT---ANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERY
: .. ....:: .::. .: ..:: :::....:..::..:. ::.:::: .:. :
CCDS56 LLIAGVTATQAGLVFLLAHTRHPSSIWLCYAAFVLFRGSYQFLVPIATFQIASSLSKELC
340 350 360 370 380 390
410 420 430 440 450 460
pF1KE6 ALVFGINTFIALVIQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMYITYS
:::::.:::.: ...::.: :: : :::.::: :
CCDS56 ALVFGVNTFFATIVKTIITFIVSDVRGLGLPVRKQNEELHVASLSLWKSHLRLAADTLSS
400 410 420 430 440 450
470 480 490
pF1KE6 TKSQKDVQSPAPSENPDVSHPEEESNIIMSTKL
CCDS56 EGSSGSGPRSWFLSPTLRAALHGPVCPSEVCPS
460 470 480
>>CCDS13725.1 SLC19A1 gene_id:6573|Hs108|chr21 (591 aa)
initn: 1219 init1: 678 opt: 682 Z-score: 839.9 bits: 165.1 E(32554): 1.8e-40
Smith-Waterman score: 1214; 41.5% identity (72.3% similar) in 470 aa overlap (11-474:24-469)
10 20 30 40
pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLT
:: . . ::..::....::.: :. ::: :::::.:
CCDS13 MVPSSPAVEKQVPVEPGPDPELRSWRHLVCYLCFYGFMAQIRPGESFITPYLLGPDKNFT
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE6 SAEITNEIFPVWTYSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQ
..:::: :: .::::..:.:::.::::.:: ::..:::.::. .:::::.:..: ::
CCDS13 REQVTNEITPVLSYSYLAVLVPVFLLTDYLRYTPVLLLQGLSFVSVWLLLLLGHSVAHMQ
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 VVEFFYGMVTAAEVAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANM
..:.::... ::..:: .::.:.: : .::::.:: :...: . ..:::.::::... .
CCDS13 LMELFYSVTMAARIAYSSYIFSLVRPARYQRVAGYSRAAVLLGVFTSSVLGQLLVTVGRV
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE6 SYFYLNVISLASVSVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPG
:. :: :::: .. . ...::: ::.:.::. . . :.: ::. . : ::
CCDS13 SFSTLNYISLAFLTFSVVLALFLKRPKRSLFFNRDDRGRCETSASE---LERMNPG--PG
190 200 210 220 230
230 240 250 260 270 280
pF1KE6 CEEQKPTSEILSTSGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAF
:::... . : :... ...: . .: :::::.:
CCDS13 --------------GKLGHALRVACGDS-----VLARMLRELGDSLRRPQLRLWSLWWVF
240 250 260 270
290 300 310 320 330 340
pF1KE6 ATAGFNQVLNYVQILWDYKAPSQDSS-IYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGE
.::. :. ::.:::. :. .:. .::::..: .:. ::...::.:.::. : ..
CCDS13 NSAGYYLVVYYVHILWNEVDPTTNSARVYNGAADAASTLLGAITSFAAGFVKIRWARWSK
280 290 300 310 320 330
350 360 370 380 390 400
pF1KE6 LALVVFSVVNAGSLFLMHYT---ANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERY
: .. ....:: .::. .: ..:: :::....:..::..:. ::.:::: .:. :
CCDS13 LLIAGVTATQAGLVFLLAHTRHPSSIWLCYAAFVLFRGSYQFLVPIATFQIASSLSKELC
340 350 360 370 380 390
410 420 430 440 450 460
pF1KE6 ALVFGINTFIALVIQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMY--IT
:::::.:::.: ...::.: :: : :::.::: :: .:. :: ... :... .: .
CCDS13 ALVFGVNTFFATIVKTIITFIVSDVRGLGLPVRKQFQLYSVYFLILSIIYFLGAMLDGLR
400 410 420 430 440 450
470 480 490
pF1KE6 YSTKSQKDVQSPAPSENPDVSHPEEESNIIMSTKL
. .... : ::
CCDS13 HCQRGHHPRQPPAQGLRSAAEEKAAQALSVQDKGLGGLQPAQSPPLSPEDSLGAVGPASL
460 470 480 490 500 510
>>CCDS56217.1 SLC19A1 gene_id:6573|Hs108|chr21 (551 aa)
initn: 1092 init1: 551 opt: 555 Z-score: 683.6 bits: 136.1 E(32554): 9.3e-32
Smith-Waterman score: 1087; 40.2% identity (70.2% similar) in 453 aa overlap (28-474:1-429)
10 20 30 40 50 60
pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLTSAEITNEIFPVWT
:::. : : . .:.:::: :: .
CCDS56 MRPQPAEPAPGGRGNEACSIHSEVTNEITPVLS
10 20 30
70 80 90 100 110 120
pF1KE6 YSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQVVEFFYGMVTAAE
::::..:.:::.::::.:: ::..:::.::. .:::::.:..: ::..:.::... ::.
CCDS56 YSYLAVLVPVFLLTDYLRYTPVLLLQGLSFVSVWLLLLLGHSVAHMQLMELFYSVTMAAR
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE6 VAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANMSYFYLNVISLASV
.:: .::.:.: : .::::.:: :...: . ..:::.::::... .:. :: :::: .
CCDS56 IAYSSYIFSLVRPARYQRVAGYSRAAVLLGVFTSSVLGQLLVTVGRVSFSTLNYISLAFL
100 110 120 130 140 150
190 200 210 220 230 240
pF1KE6 SVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPGCEEQKPTSEILST
. . ...::: ::.:.::. . . :.: ::. . : ::
CCDS56 TFSVVLALFLKRPKRSLFFNRDDRGRCETSAS---ELERMNPG--PG-------------
160 170 180 190
250 260 270 280 290 300
pF1KE6 SGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAFATAGFNQVLNYVQ
:::... . : :... ...: . .: :::::.: .::. :. ::.
CCDS56 -GKLGHALRVACGDS-----VLARMLRELGDSLRRPQLRLWSLWWVFNSAGYYLVVYYVH
200 210 220 230 240
310 320 330 340 350
pF1KE6 ILWDYKAPSQDSS-IYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGELALVVFSVVNAGS
:::. :. .:. .::::..: .:. ::...::.:.::. : ..: .. ....::
CCDS56 ILWNEVDPTTNSARVYNGAADAASTLLGAITSFAAGFVKIRWARWSKLLIAGVTATQAGL
250 260 270 280 290 300
360 370 380 390 400 410
pF1KE6 LFLMHYT---ANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERYALVFGINTFIALV
.::. .: ..:: :::....:..::..:. ::.:::: .:. : :::::.:::.: .
CCDS56 VFLLAHTRHPSSIWLCYAAFVLFRGSYQFLVPIATFQIASSLSKELCALVFGVNTFFATI
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE6 IQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMY--ITYSTKSQKDVQSPA
..::.: :: : :::.::: :: .:. :: ... :... .: . . .... : ::
CCDS56 VKTIITFIVSDVRGLGLPVRKQFQLYSVYFLILSIIYFLGAMLDGLRHCQRGHHPRQPPA
370 380 390 400 410 420
480 490
pF1KE6 PSENPDVSHPEEESNIIMSTKL
CCDS56 QGLRSAAEEKAAQALSVQDKGLGGLQPAQSPPLSPEDSLGAVGPASLEQRQSDPYLAQAP
430 440 450 460 470 480
496 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 12:58:33 2016 done: Tue Nov 8 12:58:34 2016
Total Scan time: 1.980 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]