FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2474, 1333 aa 1>>>pF1KE2474 1333 - 1333 aa - 1333 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2972+/-0.00106; mu= 23.0723+/- 0.064 mean_var=71.7751+/-14.181, 0's: 0 Z-trim(103.5): 21 B-trim: 0 in 0/50 Lambda= 0.151387 statistics sampled from 7451 (7459) to 7451 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.585), E-opt: 0.2 (0.229), width: 16 Scan time: 5.400 The best scores are: opt bits E(32554) CCDS1775.1 XDH gene_id:7498|Hs108|chr2 (1333) 8939 1962.7 0 CCDS33360.1 AOX1 gene_id:316|Hs108|chr2 (1338) 4523 998.2 0 >>CCDS1775.1 XDH gene_id:7498|Hs108|chr2 (1333 aa) initn: 8939 init1: 8939 opt: 8939 Z-score: 10540.5 bits: 1962.7 E(32554): 0 Smith-Waterman score: 8939; 100.0% identity (100.0% similar) in 1333 aa overlap (1-1333:1-1333) 10 20 30 40 50 60 pF1KE2 MTADKLVFFVNGRKVVEKNADPETTLLAYLRRKLGLSGTKLGCGEGGCGACTVMLSKYDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 MTADKLVFFVNGRKVVEKNADPETTLLAYLRRKLGLSGTKLGCGEGGCGACTVMLSKYDR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LQNKIVHFSANACLAPICSLHHVAVTTVEGIGSTKTRLHPVQERIAKSHGSQCGFCTPGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 LQNKIVHFSANACLAPICSLHHVAVTTVEGIGSTKTRLHPVQERIAKSHGSQCGFCTPGI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 VMSMYTLLRNQPEPTMEEIENAFQGNLCRCTGYRPILQGFRTFARDGGCCGGDGNNPNCC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 VMSMYTLLRNQPEPTMEEIENAFQGNLCRCTGYRPILQGFRTFARDGGCCGGDGNNPNCC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 MNQKKDHSVSLSPSLFKPEEFTPLDPTQEPIFPPELLRLKDTPRKQLRFEGERVTWIQAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 MNQKKDHSVSLSPSLFKPEEFTPLDPTQEPIFPPELLRLKDTPRKQLRFEGERVTWIQAS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TLKELLDLKAQHPDAKLVVGNTEIGIEMKFKNMLFPMIVCPAWIPELNSVEHGPDGISFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 TLKELLDLKAQHPDAKLVVGNTEIGIEMKFKNMLFPMIVCPAWIPELNSVEHGPDGISFG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 AACPLSIVEKTLVDAVAKLPAQKTEVFRGVLEQLRWFAGKQVKSVASVGGNIITASPISD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 AACPLSIVEKTLVDAVAKLPAQKTEVFRGVLEQLRWFAGKQVKSVASVGGNIITASPISD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 LNPVFMASGAKLTLVSRGTRRTVQMDHTFFPGYRKTLLSPEEILLSIEIPYSREGEYFSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 LNPVFMASGAKLTLVSRGTRRTVQMDHTFFPGYRKTLLSPEEILLSIEIPYSREGEYFSA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 FKQASRREDDIAKVTSGMRVLFKPGTTEVQELALCYGGMANRTISALKTTQRQLSKLWKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 FKQASRREDDIAKVTSGMRVLFKPGTTEVQELALCYGGMANRTISALKTTQRQLSKLWKE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 ELLQDVCAGLAEELHLPPDAPGGMVDFRCTLTLSFFFKFYLTVLQKLGQENLEDKCGKLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 ELLQDVCAGLAEELHLPPDAPGGMVDFRCTLTLSFFFKFYLTVLQKLGQENLEDKCGKLD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 PTFASATLLFQKDPPADVQLFQEVPKGQSEEDMVGRPLPHLAADMQASGEAVYCDDIPRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 PTFASATLLFQKDPPADVQLFQEVPKGQSEEDMVGRPLPHLAADMQASGEAVYCDDIPRY 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 ENELSLRLVTSTRAHAKIKSIDTSEAKKVPGFVCFISADDVPGSNITGICNDETVFAKDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 ENELSLRLVTSTRAHAKIKSIDTSEAKKVPGFVCFISADDVPGSNITGICNDETVFAKDK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 VTCVGHIIGAVVADTPEHTQRAAQGVKITYEELPAIITIEDAIKNNSFYGPELKIEKGDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 VTCVGHIIGAVVADTPEHTQRAAQGVKITYEELPAIITIEDAIKNNSFYGPELKIEKGDL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 KKGFSEADNVVSGEIYIGGQEHFYLETHCTIAVPKGEAGEMELFVSTQNTMKTQSFVAKM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 KKGFSEADNVVSGEIYIGGQEHFYLETHCTIAVPKGEAGEMELFVSTQNTMKTQSFVAKM 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 LGVPANRIVVRVKRMGGGFGGKETRSTVVSTAVALAAYKTGRPVRCMLDRDEDMLITGGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 LGVPANRIVVRVKRMGGGFGGKETRSTVVSTAVALAAYKTGRPVRCMLDRDEDMLITGGR 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 HPFLARYKVGFMKTGTVVALEVDHFSNVGNTQDLSQSIMERALFHMDNCYKIPNIRGTGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 HPFLARYKVGFMKTGTVVALEVDHFSNVGNTQDLSQSIMERALFHMDNCYKIPNIRGTGR 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 LCKTNLPSNTAFRGFGGPQGMLIAECWMSEVAVTCGMPAEEVRRKNLYKEGDLTHFNQKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 LCKTNLPSNTAFRGFGGPQGMLIAECWMSEVAVTCGMPAEEVRRKNLYKEGDLTHFNQKL 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 EGFTLPRCWEECLASSQYHARKSEVDKFNKENCWKKRGLCIIPTKFGISFTVPFLNQAGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 EGFTLPRCWEECLASSQYHARKSEVDKFNKENCWKKRGLCIIPTKFGISFTVPFLNQAGA 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 LLHVYTDGSVLLTHGGTEMGQGLHTKMVQVASRALKIPTSKIYISETSTNTVPNTSPTAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 LLHVYTDGSVLLTHGGTEMGQGLHTKMVQVASRALKIPTSKIYISETSTNTVPNTSPTAA 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE2 SVSADLNGQAVYAACQTILKRLEPYKKKNPSGSWEDWVTAAYMDTVSLSATGFYRTPNLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 SVSADLNGQAVYAACQTILKRLEPYKKKNPSGSWEDWVTAAYMDTVSLSATGFYRTPNLG 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE2 YSFETNSGNPFHYFSYGVACSEVEIDCLTGDHKNLRTDIVMDVGSSLNPAIDIGQVEGAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 YSFETNSGNPFHYFSYGVACSEVEIDCLTGDHKNLRTDIVMDVGSSLNPAIDIGQVEGAF 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE2 VQGLGLFTLEELHYSPEGSLHTRGPSTYKIPAFGSIPIEFRVSLLRDCPNKKAIYASKAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 VQGLGLFTLEELHYSPEGSLHTRGPSTYKIPAFGSIPIEFRVSLLRDCPNKKAIYASKAV 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE2 GEPPLFLAASIFFAIKDAIRAARAQHTGNNVKELFRLDSPATPEKIRNACVDKFTTLCVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 GEPPLFLAASIFFAIKDAIRAARAQHTGNNVKELFRLDSPATPEKIRNACVDKFTTLCVT 1270 1280 1290 1300 1310 1320 1330 pF1KE2 GVPENCKPWSVRV ::::::::::::: CCDS17 GVPENCKPWSVRV 1330 >>CCDS33360.1 AOX1 gene_id:316|Hs108|chr2 (1338 aa) initn: 4041 init1: 2246 opt: 4523 Z-score: 5328.0 bits: 998.2 E(32554): 0 Smith-Waterman score: 4523; 50.0% identity (78.2% similar) in 1342 aa overlap (3-1333:4-1338) 10 20 30 40 50 pF1KE2 MTADKLVFFVNGRKVVEKNADPETTLLAYLRRKLGLSGTKLGCGEGGCGACTVMLSKYD :..:.:.::::::.:::.:::: :: :::.:: :.::: ::: :::::::::.:.:. CCDS33 MDRASELLFYVNGRKVIEKNVDPETMLLPYLRKKLRLTGTKYGCGGGGCGACTVMISRYN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 RLQNKIVHFSANACLAPICSLHHVAVTTVEGIGSTKTRLHPVQERIAKSHGSQCGFCTPG . ..: : ::::: :::::. .:::::::::::.::.::::::::: ::.:::::::: CCDS33 PITKRIRHHPANACLIPICSLYGAAVTTVEGIGSTHTRIHPVQERIAKCHGTQCGFCTPG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 IVMSMYTLLRNQPEPTMEEIENAFQGNLCRCTGYRPILQGFRTFARDGGCCGGDGNNPNC .:::.::::::.::::.... .:. ::::::::::::... .:: . .::: . .: : CCDS33 MVMSIYTLLRNHPEPTLDQLTDALGGNLCRCTGYRPIIDACKTFCKTSGCCQSK-ENGVC 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 CMNQ------KKDHSVSLSPSLFKPEEFTPLDPTQEPIFPPELLRLKDTPRKQLR-FEGE :..: . ... . ::.:: ::: ::::::: ::::::. . . .. : : .: CCDS33 CLDQGINGLPEFEEGSKTSPKLFAEEEFLPLDPTQELIFPPELMIMAEKQSQRTRVFGSE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 RVTWIQASTLKELLDLKAQHPDAKLVVGNTEIGIEMKFKNMLFPMIVCPAWIPELNSVEH :. :.. ::::::..: ..:.: ...::: .: :.:::... :.:. : : ::. :.: CCDS33 RMMWFSPVTLKELLEFKFKYPQAPVIMGNTSVGPEVKFKGVFHPVIISPDRIEELSVVNH 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 GPDGISFGAACPLSIVEKTLVDAVAKLPAQKTEVFRGVLEQLRWFAGKQVKSVASVGGNI . .:...::. :. :. :.:.: ::: .::......:..: .::.:....::.::.: CCDS33 AYNGLTLGAGLSLAQVKDILADVVQKLPEEKTQMYHALLKHLGTLAGSQIRNMASLGGHI 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 ITASPISDLNPVFMASGAKLTLVSRGTRRTVQMDHTFFPGYRKTLLSPEEILLSIEIPYS :. : :::::.. ... :.:.:. .: . ... :. .. :.:.:::.:..:::: CCDS33 ISRHPDSDLNPILAVGNCTLNLLSKEGKRQIPLNEQFLSKCPNADLKPQEILVSVNIPYS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 REGEYFSAFKQASRREDDIAKVTSGMRVLFKPGTTEVQELALCYGGMANRTISALKTTQR :. :. :::.::.:.:. .: :.:::::.: : ..:: . :::.. :: : .. :. CCDS33 RKWEFVSAFRQAQRQENALAIVNSGMRVFFGEGDGIIRELCISYGGVGPATICAKNSCQK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 QLSKLWKEELLQDVCAGLAEELHLPPDAPGGMVDFRCTLTLSFFFKFYLTVLQKLGQENL ... :.:..:. .: . .:. : .:::: :.:. :: .::.::::: : : : . . CCDS33 LIGRHWNEQMLDIACRLILNEVSLLGSAPGGKVEFKRTLIISFLFKFYLEVSQILKKMD- 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 EDKCGKLDPTFASATLLFQKDPPADVQLFQEVPKGQSEEDMVGRPLPHLAADMQASGEAV . .: . :: ... .. .:.. : :: .:.:. ::.. .:.:::. CCDS33 PVHYPSLADKYESALEDLHSKHHCSTLKYQNIGPKQHPEDPIGHPIMHLSGVKHATGEAI 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 YCDDIPRYENELSLRLVTSTRAHAKIKSIDTSEAKKVPGFVCFISADDVPGSNITGIC-- ::::.: ..:: : .:::.:::::: ::: ::: ..:: : ...:. . :.....: CCDS33 YCDDMPLVDQELFLTFVTSSRAHAKIVSIDLSEALSMPGVVDIMTAEHL--SDVNSFCFF 600 610 620 630 640 650 660 670 680 690 700 pF1KE2 -NDETVFAKDKVTCVGHIIGAVVADTPEHTQRAAQGVKITYEEL-PAIITIEDAIKNNSF . : .: ::: :::... ::.::. ...:::. :::.:..: : :.:::..:..:: CCDS33 TEAEKFLATDKVFCVGQLVCAVLADSEVQAKRAAKRVKIVYQDLEPLILTIEESIQHNSS 660 670 680 690 700 710 710 720 730 740 750 760 pF1KE2 YGPELKIEKGDLKKGFSEADNVVSGEIYIGGQEHFYLETHCTIAVPKGEAGEMELFVSTQ . :: :.: :.. ..:. .:... :::..:::::::.::. ..::::: ::...:::: CCDS33 FKPERKLEYGNVDEAFKVVDQILEGEIHMGGQEHFYMETQSMLVVPKGEDQEMDVYVSTQ 720 730 740 750 760 770 770 780 790 800 810 820 pF1KE2 NTMKTQSFVAKMLGVPANRIVVRVKRMGGGFGGKETRSTVVSTAVALAAYKTGRPVRCML :..::. : .:::... .:.:.::.:::: .. ......:.:: : :: :::.: CCDS33 FPKYIQDIVASTLKLPANKVMCHVRRVGGAFGGKVLKTGIIAAVTAFAANKHGRAVRCVL 780 790 800 810 820 830 830 840 850 860 870 880 pF1KE2 DRDEDMLITGGRHPFLARYKVGFMKTGTVVALEVDHFSNVGNTQDLSQSIMERALFHMDN .: :::::::::::.:..::.:::. : ..::...:.::.: . : : ..: .:..::: CCDS33 ERGEDMLITGGRHPYLGKYKAGFMNDGRILALDMEHYSNAGASLDESLFVIEMGLLKMDN 840 850 860 870 880 890 890 900 910 920 930 940 pF1KE2 CYKIPNIRGTGRLCKTNLPSNTAFRGFGGPQGMLIAECWMSEVAVTCGMPAEEVRRKNLY ::.::.: : :.::::::::::::: ::. ::.: ..:::. ::. :.:: :.: CCDS33 AYKFPNLRCRGWACRTNLPSNTAFRGFGFPQAALITESCITEVAAKCGLSPEKVRIINMY 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KE2 KEGDLTHFNQKLEGFTLPRCWEECLASSQYHARKSEVDKFNKENCWKKRGLCIIPTKFGI :: : : ..:.... .: .::.::.: :.: :: :.::: :: :::.:: ..: :: . CCDS33 KEIDQTPYKQEINAKNLIQCWRECMAMSSYSLRKVAVEKFNAENYWKKKGLAMVPLKFPV 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 1060 pF1KE2 SFTVPFLNQAGALLHVYTDGSVLLTHGGTEMGQGLHTKMVQVASRALKIPTSKIYISETS .. .::.::.:.: :::::.:::: :::::.::::.::.:: :..: :.... :: CCDS33 GLGSRAAGQAAALVHIYLDGSVLVTHGGIEMGQGVHTKMIQVVSRELRMPMSNVHLRGTS 1020 1030 1040 1050 1060 1070 1070 1080 1090 1100 1110 1120 pF1KE2 TNTVPNTSPTAASVSADLNGQAVYAACQTILKRLEPYKKKNPSGSWEDWVTAAYMDTVSL :.::::.. ...:: ::::: :: ::::.:::::: .:::.:.:.::. .:. ....: CCDS33 TETVPNANISGGSVVADLNGLAVKDACQTLLKRLEPIISKNPKGTWKDWAQTAFDESINL 1080 1090 1100 1110 1120 1130 1130 1140 1150 1160 1170 1180 pF1KE2 SATGFYRTPNLGYSFETNSGNPFHYFSYGVACSEVEIDCLTGDHKNLRTDIVMDVGSSLN ::.:..: . ...: . :.::.:: ::.::::::::::::::::.::::::::: :.: CCDS33 SAVGYFRGYESDMNWEKGEGQPFEYFVYGAACSEVEIDCLTGDHKNIRTDIVMDVGCSIN 1140 1150 1160 1170 1180 1190 1190 1200 1210 1220 1230 1240 pF1KE2 PAIDIGQVEGAFVQGLGLFTLEELHYSPEGSLHTRGPSTYKIPAFGSIPIEFRVSLLRDC :::::::.::::.::.::.:.:::.:::.: ::::::. :::::. ..: :....:: CCDS33 PAIDIGQIEGAFIQGMGLYTIEELNYSPQGILHTRGPDQYKIPAICDMPTELHIALLPPS 1200 1210 1220 1230 1240 1250 1250 1260 1270 1280 1290 1300 pF1KE2 PNKKAIYASKAVGEPPLFLAASIFFAIKDAIRAARAQHTGNNVKELFRLDSPATPEKIRN :....:.::..:: .::. :.::::.::. ::: :. : .. . :.:: :::::: CCDS33 QNSNTLYSSKGLGESGVFLGCSVFFAIHDAVSAAR-QERG--LHGPLTLNSPLTPEKIRM 1260 1270 1280 1290 1300 1310 1310 1320 1330 pF1KE2 ACVDKFTTLCVTGVPENCKPWSVRV :: :::: . : . ::.: . CCDS33 ACEDKFTKMIPRDEPGSYVPWNVPI 1320 1330 1333 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 20:37:51 2016 done: Mon Nov 7 20:37:52 2016 Total Scan time: 5.400 Total Display time: 0.190 Function used was FASTA [36.3.4 Apr, 2011]