FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2555, 456 aa
1>>>pF1KE2555 456 - 456 aa - 456 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0595+/-0.000863; mu= 13.8918+/- 0.051
mean_var=74.2683+/-14.871, 0's: 0 Z-trim(107.2): 17 B-trim: 36 in 2/48
Lambda= 0.148824
statistics sampled from 9451 (9462) to 9451 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.656), E-opt: 0.2 (0.291), width: 16
Scan time: 2.680
The best scores are: opt bits E(32554)
CCDS8137.1 SLC29A2 gene_id:3177|Hs108|chr11 ( 456) 3003 654.1 8.5e-188
CCDS73326.1 SLC29A2 gene_id:3177|Hs108|chr11 ( 361) 1577 347.9 1e-95
CCDS4908.1 SLC29A1 gene_id:2030|Hs108|chr6 ( 456) 625 143.5 4.2e-34
CCDS7310.1 SLC29A3 gene_id:55315|Hs108|chr10 ( 475) 366 87.9 2.4e-17
CCDS5340.1 SLC29A4 gene_id:222962|Hs108|chr7 ( 530) 272 67.8 3.2e-11
>>CCDS8137.1 SLC29A2 gene_id:3177|Hs108|chr11 (456 aa)
initn: 3003 init1: 3003 opt: 3003 Z-score: 3485.1 bits: 654.1 E(32554): 8.5e-188
Smith-Waterman score: 3003; 100.0% identity (100.0% similar) in 456 aa overlap (1-456:1-456)
10 20 30 40 50 60
pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNSTARILSTNHTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNSTARILSTNHTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 PEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAILLLFALTAALVKVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 PEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAILLLFALTAALVKVD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 MSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQGLAGIFAALAMLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 MSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQGLAGIFAALAMLL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 SMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKSSQAQAQELETKAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 SMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKSSQAQAQELETKAE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 LLQSDENGIPSSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTVFQKIWLTALCLVLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 LLQSDENGIPSSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTVFQKIWLTALCLVLV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 FTVTLSVFPAITAMVTSSTSPGKWSQFFNPICCFLLFNIMDWLGRSLTSYFLWPDEDSRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 FTVTLSVFPAITAMVTSSTSPGKWSQFFNPICCFLLFNIMDWLGRSLTSYFLWPDEDSRL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 LPLLVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAVSNGYLVSLTMCLAPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 LPLLVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAVSNGYLVSLTMCLAPR
370 380 390 400 410 420
430 440 450
pF1KE2 QVLPHEREVAGALMTFFLALGLSCGASLSFLFKALL
::::::::::::::::::::::::::::::::::::
CCDS81 QVLPHEREVAGALMTFFLALGLSCGASLSFLFKALL
430 440 450
>>CCDS73326.1 SLC29A2 gene_id:3177|Hs108|chr11 (361 aa)
initn: 1574 init1: 1574 opt: 1577 Z-score: 1832.0 bits: 347.9 E(32554): 1e-95
Smith-Waterman score: 1577; 97.6% identity (99.2% similar) in 252 aa overlap (1-250:1-252)
10 20 30 40 50 60
pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNSTARILSTNHTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNSTARILSTNHTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 PEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAILLLFALTAALVKVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 PEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAILLLFALTAALVKVD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 MSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQGLAGIFAALAMLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 MSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQGLAGIFAALAMLL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 SMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKSSQAQAQELETKAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 SMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKSSQAQAQELETKAE
190 200 210 220 230 240
250 260 270 280 290
pF1KE2 LLQSD--ENGIPSSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTVFQKIWLTALCLV
::::: ....:
CCDS73 LLQSDLADSAVPCVGLHSHPVRLPRHHSHGDQLHQSWEVESVLQPHLLLPPLQHHGLAGT
250 260 270 280 290 300
>>CCDS4908.1 SLC29A1 gene_id:2030|Hs108|chr6 (456 aa)
initn: 1238 init1: 616 opt: 625 Z-score: 725.7 bits: 143.5 E(32554): 4.2e-34
Smith-Waterman score: 1358; 47.1% identity (73.0% similar) in 471 aa overlap (1-456:1-456)
10 20 30 40 50
pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNS---TARI----
:. . :.: :. : . ::.::::::::::::.:: :: :: . : ::..
CCDS49 MTTSHQPQDRYKAVWLIFFMLGLGTLLPWNFFMTATQYFTNRLDMSQNVSLVTAELSKDA
10 20 30 40 50 60
60 70 80 90 100
pF1KE2 -LSTNHTGPEDAFN-----FNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAIL
:. ..: : ::: .:: ..::::::: :::::.: .:..:::::::.:::
CCDS49 QASAAPAAPLPERNSLSAIFNNVMTLCAMLPLLLFTYLNSFLHQRIPQSVRILGSLVAIL
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE2 LLFALTAALVKVDMSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQ
:.: .:: ::::... ::: ::: .. .::::.:.::::::: : .:..:.. ..:::
CCDS49 LVFLITAILVKVQLDALPFFVITMIKIVLINSFGAILQGSLFGLAGLLPASYTAPIMSGQ
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE2 GLAGIFAALAMLLSMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKS
::::.::..::. ..::: . ::.::::: :. :...:.:::.::.:.: ::: :
CCDS49 GLAGFFASVAMICAIASGSELSESAFGYFITACAVIILTIICYLGLPRLEFYRYYQQLKL
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE2 SQAQAQELETKAELLQSDENGIP-SSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTV
: ::: .:... :. : .. .. ..... ...: .: :. ..
CCDS49 EGPGEQ--ETKLDLISKGEE--PRAGKEESGVSVS---NSQPTNESH--------SIKAI
250 260 270 280
290 300 310 320 330 340
pF1KE2 FQKIWLTALCLVLVFTVTLSVFPAITAMVTSSTSPGK-WSQFFNPICCFLLFNIMDWLGR
...: . :. . ..::.:...:::.:. : :: . .. : ..: :. ::: :::.:::::
CCDS49 LKNISVLAFSVCFIFTITIGMFPAVTVEVKSSIAGSSTWERYFIPVSCFLTFNIFDWLGR
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE2 SLTSYFLWPDEDSRLLPLLVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAV
:::. :.:: .::: :: :: :..::::..::.. : : ..: .::.:: :: ::
CCDS49 SLTAVFMWPGKDSRWLPSLVLARLVFVPLLLLCNIKPRRYLTVVFEHDAWFIFFMAAFAF
350 360 370 380 390 400
410 420 430 440 450
pF1KE2 SNGYLVSLTMCLAPRQVLPHEREVAGALMTFFLALGLSCGASLSFLFKALL
:::::.:: ::..:..: : : :.:::.:.::: :::. :: .::::.:..
CCDS49 SNGYLASLCMCFGPKKVKPAEAETAGAIMAFFLCLGLALGAVFSFLFRAIV
410 420 430 440 450
>>CCDS7310.1 SLC29A3 gene_id:55315|Hs108|chr10 (475 aa)
initn: 560 init1: 172 opt: 366 Z-score: 424.9 bits: 87.9 E(32554): 2.4e-17
Smith-Waterman score: 759; 32.3% identity (63.5% similar) in 458 aa overlap (7-456:46-475)
10 20 30
pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAI
:.: . . : :: ::.:.::::::::::
CCDS73 TYRTTSSSLRADQEALLEKLLDRPPPGLQRPEDRFCGTYIIFFSLGIGSLLPWNFFITAK
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE2 PYFQARLAGAGNSTARILSTNHTGPEDAFN-FNNWVTLLSQLPLLLFTLLNSFLYQCVPE
:.. .: ::.. . . : : .: :...... : .: .: . : .: . :
CCDS73 EYWMFKLR---NSSSPATGEDPEGS-DILNYFESYLAVASTVPSMLCLVANFLLVNRVAV
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE2 TVRILGSLLAILLLFALTAALVKVDMSPGP--FFSITMASVCFINSFSAVLQGSLFGQLG
.:.:.:: .:: .: . .:::::: : ::..:.. . .... :.:...:..:. :
CCDS73 HIRVLASLTVILAIFMVITALVKVDTSSWTRGFFAVTIVCMVILSGASTVFSSSIYGMTG
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE2 TMPSTYSTLFLSGQGLAGIFAALAMLLSMASGVDAETSALGYFITPCVGILMSIVCYLSL
..: : ..:: ...: .:.: :...:.. :...:::..:.: : ... . :: :
CCDS73 SFPMRNSQALISGGAMGGTVSAVASLVDLAASSDVRNSALAFFLTATVFLVLCMGLYLLL
200 210 220 230 240 250
220 230 240 250 260 270
pF1KE2 PHLKFARYYLANKSSQAQAQELETKAELLQSDENGIPSSPQKVALTLDLDLEKEPESEPD
.:..::::. . : .. . : : .: . :: .. :
CCDS73 SRLEYARYYM----RPVLAAHVFSGEEELPQDSLSAPSVASRFI---------------D
260 270 280 290
280 290 300 310 320 330
pF1KE2 EPQKPGKPSVFTVFQKIWLTALCLVLVFTVTLSVFPAITAMVTS--STSPGKWS-QFFNP
: .: ...: ..:.. :: .: ..::: . . : . : . :. .:: :
CCDS73 SHTPPLRP----ILKKTASLGFCVTYVFFITSLIYPAICTNIESLNKGSGSLWTTKFFIP
300 310 320 330 340
340 350 360 370 380
pF1KE2 ICCFLLFNIMDWLGRSLTSYFLWPDEDSRLLPLLVCLRFLFVPLFMLCHVPQRSRLP-IL
. :::.:. : ::.::... : .:. :: .: :: ..:::.::. : .: ..
CCDS73 LTTFLLYNFADLCGRQLTAWIQVPGPNSKALPGFVLLRTCLIPLFVLCNYQPRVHLKTVV
350 360 370 380 390 400
390 400 410 420 430 440
pF1KE2 FPQDAYFITFMLLFAVSNGYLVSLTMCLAPRQVLPHE-REVAGALMTFFLALGLSCGASL
: .:.: . :...::::: .:.. .:. ..:.: :..:..:.:.. :::. :..
CCDS73 FQSDVYPALLSSLLGLSNGYLSTLALLYGPK-IVPRELAEATGVVMSFYVCLGLTLGSAC
410 420 430 440 450 460
450
pF1KE2 SFLFKALL
: :. :.
CCDS73 STLLVHLI
470
>>CCDS5340.1 SLC29A4 gene_id:222962|Hs108|chr7 (530 aa)
initn: 349 init1: 128 opt: 272 Z-score: 315.0 bits: 67.8 E(32554): 3.2e-11
Smith-Waterman score: 447; 26.0% identity (54.3% similar) in 477 aa overlap (7-450:63-503)
10 20 30
pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAI
: : :: . ..... :.: :::.: ::: .
CCDS53 LEEAAEAAQGQGLRARGVPAFTDTTLDEPVPDDRYHAIYFAMLLAGVGFLLPYNSFITDV
40 50 60 70 80 90
40 50 60 70 80 90
pF1KE2 PYFQARLAGAGNSTARILSTNHTGPEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPET
:.. : : .. :. ..: : : .:::. : . .
CCDS53 DYLH-----------------HKYPGTSIVFD--MSLTYILVALAAVLLNNVLVERLTLH
100 110 120 130
100 110 120 130 140 150
pF1KE2 VRIL-GSLLAILLLFALTAALVKVDM-SPGPFFSITMASVCFINSFSAVLQGSLFGQLGT
.:: : :::. :. .. : ... : ..:..:.: . .: :.:..: :
CCDS53 TRITAGYLLALGPLLFISICDVWLQLFSRDQAYAINLAAVGTVAFGCTVQQSSFYGYTGM
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE2 MPSTYSTLFLSGQGLAGIFAALAMLLSMASGVDAETSALGYFITPCVGILMSIVCYLSLP
.:. :. ..:.. ::.. .:. .:. : ..:.: .:. :.. . ..:.:
CCDS53 LPKRYTQGVMTGESTAGVMISLSRILTKLLLPDERASTLIFFL---VSVALELLCFLL--
200 210 220 230 240
220 230 240
pF1KE2 HL-----KFARYYLANKSSQAQAQ--------------------ELETKAELLQSDENGI
:: .:. .: . .. ... ..: : : .:.
CCDS53 HLLVRRSRFVLFYTTRPRDSHRGRPGLGRGYGYRVHHDVVAGDVHFEHPAPALAPNESPK
250 260 270 280 290 300
250 260 270 280 290 300
pF1KE2 PSSPQKVALT----LDLDLEKEPESEPDEPQ-KPGKPSVFTVFQKIWLTALCLVLVFTVT
: ..:. . . .:. . :. . . : . ..: . :: : ..... .:
CCDS53 DSPAHEVTGSGGAYMRFDVPR-PRVQRSWPTFRALLLHRYVVARVIWADMLSIAVTYFIT
310 320 330 340 350 360
310 320 330 340 350 360
pF1KE2 LSVFPAITAMVTSSTSPGKWSQFFNPICCFLLFNIMDWLGRSLTSYFL-WPDEDSRLLPL
: .::.. . . :.: :: . .::. :..:. :.. . : . ..::
CCDS53 LCLFPGLESEIRHCIL-GEWL----PILIMAVFNLSDFVGKILAALPVDW--RGTHLLAC
370 380 390 400 410 420
370 380 390 400 410 420
pF1KE2 LVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAVSNGYLVSLTMCLAPRQVL
::: .:.:::.:: : : .: : . :. : ::...::::. :. : :: .:
CCDS53 -SCLRVVFIPLFILCVYP--SGMPALR-HPAWPCIFSLLMGISNGYFGSVPMILAAGKVS
430 440 450 460 470
430 440 450
pF1KE2 PHEREVAGALMTFFLALGLSCGASLSFLFKALL
:..::.:: :: ::. :.....
CCDS53 PKQRELAGNTMTVSYMSGLTLGSAVAYCTYSLTRDAHGSCLHASTANGSILAGL
480 490 500 510 520 530
456 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 10:49:23 2016 done: Tue Nov 8 10:49:23 2016
Total Scan time: 2.680 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]