FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6150, 640 aa 1>>>pF1KB6150 640 - 640 aa - 640 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.6312+/-0.00101; mu= 13.2988+/- 0.061 mean_var=93.3677+/-18.061, 0's: 0 Z-trim(106.7): 26 B-trim: 0 in 0/51 Lambda= 0.132732 statistics sampled from 9097 (9117) to 9097 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.638), E-opt: 0.2 (0.28), width: 16 Scan time: 3.650 The best scores are: opt bits E(32554) CCDS12439.1 UBA2 gene_id:10054|Hs108|chr19 ( 640) 4204 815.6 0 CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058) 445 95.9 3.1e-19 CCDS2910.1 UBA3 gene_id:9039|Hs108|chr3 ( 449) 385 84.2 4.1e-16 CCDS2909.1 UBA3 gene_id:9039|Hs108|chr3 ( 463) 385 84.2 4.3e-16 CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052) 334 74.6 7.6e-13 >>CCDS12439.1 UBA2 gene_id:10054|Hs108|chr19 (640 aa) initn: 4204 init1: 4204 opt: 4204 Z-score: 4352.6 bits: 815.6 E(32554): 0 Smith-Waterman score: 4204; 100.0% identity (100.0% similar) in 640 aa overlap (1-640:1-640) 10 20 30 40 50 60 pF1KB6 MALSRGLPRELAEAVAGGRVLVVGAGGIGCELLKNLVLTGFSHIDLIDLDTIDVSNLNRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MALSRGLPRELAEAVAGGRVLVVGAGGIGCELLKNLVLTGFSHIDLIDLDTIDVSNLNRQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 FLFQKKHVGRSKAQVAKESVLQFYPKANIVAYHDSIMNPDYNVEFFRQFILVMNALDNRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FLFQKKHVGRSKAQVAKESVLQFYPKANIVAYHDSIMNPDYNVEFFRQFILVMNALDNRA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 ARNHVNRMCLAADVPLIESGTAGYLGQVTTIKKGVTECYECHPKPTQRTFPGCTIRNTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ARNHVNRMCLAADVPLIESGTAGYLGQVTTIKKGVTECYECHPKPTQRTFPGCTIRNTPS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 EPIHCIVWAKYLFNQLFGEEDADQEVSPDRADPEAAWEPTEAEARARASNEDGDIKRIST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EPIHCIVWAKYLFNQLFGEEDADQEVSPDRADPEAAWEPTEAEARARASNEDGDIKRIST 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 KEWAKSTGYDPVKLFTKLFKDDIRYLLTMDKLWRKRKPPVPLDWAEVQSQGEETNASDQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KEWAKSTGYDPVKLFTKLFKDDIRYLLTMDKLWRKRKPPVPLDWAEVQSQGEETNASDQQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 NEPQLGLKDQQVLDVKSYARLFSKSIETLRVHLAEKGDGAELIWDKDDPSAMDFVTSAAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NEPQLGLKDQQVLDVKSYARLFSKSIETLRVHLAEKGDGAELIWDKDDPSAMDFVTSAAN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 LRMHIFSMNMKSRFDIKSMAGNIIPAIATTNAVIAGLIVLEGLKILSGKIDQCRTIFLNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LRMHIFSMNMKSRFDIKSMAGNIIPAIATTNAVIAGLIVLEGLKILSGKIDQCRTIFLNK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 QPNPRKKLLVPCALDPPNPNCYVCASKPEVTVRLNVHKVTVLTLQDKIVKEKFAMVAPDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QPNPRKKLLVPCALDPPNPNCYVCASKPEVTVRLNVHKVTVLTLQDKIVKEKFAMVAPDV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 QIEDGKGTILISSEEGETEANNHKKLSEFGIRNGSRLQADDFLQDYTLLINILHSEDLGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QIEDGKGTILISSEEGETEANNHKKLSEFGIRNGSRLQADDFLQDYTLLINILHSEDLGK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 DVEFEVVGDAPEKVGPKQAEDAAKSITNGSDDGAQPSTSTAQEQDDVLIVDSDEEDSSNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DVEFEVVGDAPEKVGPKQAEDAAKSITNGSDDGAQPSTSTAQEQDDVLIVDSDEEDSSNN 550 560 570 580 590 600 610 620 630 640 pF1KB6 ADVSEEERSRKRKLDEKENLSAKRSRIEQKEELDDVIALD :::::::::::::::::::::::::::::::::::::::: CCDS12 ADVSEEERSRKRKLDEKENLSAKRSRIEQKEELDDVIALD 610 620 630 640 >>CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058 aa) initn: 484 init1: 235 opt: 445 Z-score: 458.9 bits: 95.9 E(32554): 3.1e-19 Smith-Waterman score: 585; 32.4% identity (59.0% similar) in 478 aa overlap (10-419:461-928) 10 20 30 pF1KB6 MALSRGLPRELAEAVAGGRVLVVGAGGIGCELLKNLVLT .: : .. . ..::::.::::::::... CCDS14 CLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMI 440 450 460 470 480 490 40 50 60 70 80 90 pF1KB6 GFS-----HIDLIDLDTIDVSNLNRQFLFQKKHVGRSKAQVAKESVLQFYPKANIVAYHD :.. .: . :.:::. :::::::::. : . :...: .: :. :. ... :. CCDS14 GLGCGEGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTS-HQ 500 510 520 530 540 100 110 120 130 140 150 pF1KB6 SIMNPD----YNVEFFRQFILVMNALDNRAARNHVNRMCLAADVPLIESGTAGYLGQVTT . ..:: :. .::... : ::::: :: ...: :. ::.:::: : :.: . CCDS14 NRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGNVQV 550 560 570 580 590 600 160 170 180 190 200 pF1KB6 IKKGVTECYECHPKPTQRTFPGCTIRNTPSEPIHCIVWAKYLFNQLFGE--EDADQEVS- . .:: : : ....: ::..: :. : . ::. :. :: . :...: .. CCDS14 VIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTD 610 620 630 640 650 660 210 220 230 240 250 260 pF1KB6 P---DRADPEAAWEPTEA-EARARASNEDGDIKRISTKEWAKSTGYDPVKLFTKLFKDDI : .:. :. .: :. :: :. ..: .: :: . . . :. ....: CCDS14 PKFVERTLRLAGTQPLEVLEAVQRSLV----LQRPQT--WADCVTWACHHWHTQ-YSNNI 670 680 690 700 710 720 270 280 290 pF1KB6 RYLLTM---DKL-------WR--KRKP---------PVPLDW----AEVQSQ-----GEE : :: :.: : :: : :. ::. :.. .: : . CCDS14 RQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTGSQ 730 740 750 760 770 780 300 310 320 330 pF1KB6 TNA-------SDQQNE--PQLGLK----DQQVLDVKSYARLFSKSIETLRVHLA--EKGD : : : : :. :.: ::.. ... : . .. .: :.. : .: CCDS14 DRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSAN--ASVDDSRLEELKATLPSPDKLP 790 800 810 820 830 840 340 350 360 370 380 390 pF1KB6 GAELI---WDKDDPSA--MDFVTSAANLRMHIFSMNMKSRFDIKSMAGNIIPAIATTNAV : .. ..::: : :::...:.::: . ... .: : .::.::::::::.:. CCDS14 GFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAA 850 860 870 880 890 900 400 410 420 430 440 450 pF1KB6 IAGLIVLEGLKILSG--KIDQCRTIFLNKQPNPRKKLLVPCALDPPNPNCYVCASKPEVT ..::. :: :...: ..:. .. ::: CCDS14 VVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEV 910 920 930 940 950 960 >>CCDS2910.1 UBA3 gene_id:9039|Hs108|chr3 (449 aa) initn: 587 init1: 290 opt: 385 Z-score: 402.7 bits: 84.2 E(32554): 4.1e-16 Smith-Waterman score: 548; 42.4% identity (63.1% similar) in 236 aa overlap (19-239:57-288) 10 20 30 40 pF1KB6 MALSRGLPRELAEAVAGGRVLVVGAGGIGCELLKNLVLTGFSHIDLID .:::.::::.::::::::.:.:: .: .:: CCDS29 VKKFLERSGPFTHPDFEPSTESLQFLLDTCKVLVIGAGGLGCELLKNLALSGFRQIHVID 30 40 50 60 70 80 50 60 70 80 90 100 pF1KB6 LDTIDVSNLNRQFLFQKKHVGRSKAQVAKESVLQFYPKANIVAYHDSIMNPDYNVEFFRQ .::::::::::::::. : .:: ::.:: : . . :. :.: . ..:. :.: :.:: CCDS29 MDTIDVSNLNRQFLFRPKDIGRPKAEVAAEFLNDRVPNCNVVPHFNKIQ--DFNDTFYRQ 90 100 110 120 130 140 110 120 130 140 150 pF1KB6 FILVMNALDNRAARNHVNRMCLA----AD--------VPLIESGTAGYLGQVTTIKKGVT : ... .::. :: .: : .. : ::::..:: :. :.. .: :.: CCDS29 FHIIVCGLDSIIARRWINGMLISLLNYEDGVLDPSSIVPLIDGGTEGFKGNARVILPGMT 150 160 170 180 190 200 160 170 180 190 200 210 pF1KB6 ECYECHPK--PTQRTFPGCTIRNTPSEPIHCIVWAKYLFNQLFGEEDADQEVSPDRADPE : :: . : : .:: ::: . : : ::: ....: : :. . : : ::: CCDS29 ACIECTLELYPPQVNFPMCTIASMPRLPEHCIEYVRML--QWPKEQPFGEGVPLDGDDPE 210 220 230 240 250 260 220 230 240 250 260 270 pF1KB6 -AAWEPTEAEARARASNEDGDIKRISTKEWAKSTGYDPVKLFTKLFKDDIRYLLTMDKLW : .. :: : : :.. CCDS29 HIQWIFQKSLERASQYNIRGVTYRLTQGVVKRIIPAVASTNAVIAAVCATEVFKIATSAY 270 280 290 300 310 320 >>CCDS2909.1 UBA3 gene_id:9039|Hs108|chr3 (463 aa) initn: 587 init1: 290 opt: 385 Z-score: 402.5 bits: 84.2 E(32554): 4.3e-16 Smith-Waterman score: 548; 42.4% identity (63.1% similar) in 236 aa overlap (19-239:71-302) 10 20 30 40 pF1KB6 MALSRGLPRELAEAVAGGRVLVVGAGGIGCELLKNLVLTGFSHIDLID .:::.::::.::::::::.:.:: .: .:: CCDS29 VKKFLERSGPFTHPDFEPSTESLQFLLDTCKVLVIGAGGLGCELLKNLALSGFRQIHVID 50 60 70 80 90 100 50 60 70 80 90 100 pF1KB6 LDTIDVSNLNRQFLFQKKHVGRSKAQVAKESVLQFYPKANIVAYHDSIMNPDYNVEFFRQ .::::::::::::::. : .:: ::.:: : . . :. :.: . ..:. :.: :.:: CCDS29 MDTIDVSNLNRQFLFRPKDIGRPKAEVAAEFLNDRVPNCNVVPHFNKIQ--DFNDTFYRQ 110 120 130 140 150 110 120 130 140 150 pF1KB6 FILVMNALDNRAARNHVNRMCLA----AD--------VPLIESGTAGYLGQVTTIKKGVT : ... .::. :: .: : .. : ::::..:: :. :.. .: :.: CCDS29 FHIIVCGLDSIIARRWINGMLISLLNYEDGVLDPSSIVPLIDGGTEGFKGNARVILPGMT 160 170 180 190 200 210 160 170 180 190 200 210 pF1KB6 ECYECHPK--PTQRTFPGCTIRNTPSEPIHCIVWAKYLFNQLFGEEDADQEVSPDRADPE : :: . : : .:: ::: . : : ::: ....: : :. . : : ::: CCDS29 ACIECTLELYPPQVNFPMCTIASMPRLPEHCIEYVRML--QWPKEQPFGEGVPLDGDDPE 220 230 240 250 260 270 220 230 240 250 260 270 pF1KB6 -AAWEPTEAEARARASNEDGDIKRISTKEWAKSTGYDPVKLFTKLFKDDIRYLLTMDKLW : .. :: : : :.. CCDS29 HIQWIFQKSLERASQYNIRGVTYRLTQGVVKRIIPAVASTNAVIAAVCATEVFKIATSAY 280 290 300 310 320 330 >>CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052 aa) initn: 641 init1: 235 opt: 334 Z-score: 344.1 bits: 74.6 E(32554): 7.6e-13 Smith-Waterman score: 529; 27.3% identity (54.5% similar) in 565 aa overlap (2-486:445-991) 10 20 30 pF1KB6 MALSRGLPRELAEAVAGGRVLVVGAGGIGCE :: . : . . . ...:: :.:::: CCDS35 QWLYLEAADIVESLGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCE 420 430 440 450 460 470 40 50 60 70 80 pF1KB6 LLKNLVLTGFS------HIDLIDLDTIDVSNLNRQFLFQKKHVGRSKAQVAKESVLQFYP .:::..: : . : . : : :. :::::::::. .:. . :. .: ...:.. CCDS35 MLKNFALLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINS 480 490 500 510 520 530 90 100 110 120 130 140 pF1KB6 KANIVAYHDSIMNPD---YNVEFFRQFILVMNALDNRAARNHVNRMCLAADVPLIESGTA . .: :. ... :: ::. . ....:::: :: .:. ::: ::..::: CCDS35 QIKIDAHLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGTM 540 550 560 570 580 590 150 160 170 180 190 pF1KB6 GYLGQVTTIKKGVTECYECHPKPTQRTFPGCTIRNTPSEPIHCIVWAK-----------Y : :.. .: .:: :. : : .. .: ::... :. : : ::. CCDS35 GTKGHTEVIVPHLTESYNSHRDPPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKPS 600 610 620 630 640 650 200 210 220 230 240 pF1KB6 LFNQLF----GEEDADQEVSPDRADPEAAWEPTEAEARARASNEDGDIKRISTKEWAKST :::... . :.. :... .. :. .. . .: : : . .. .. .. : CCDS35 LFNKFWQTYSSAEEVLQKIQSGHSL-EGCFQVIKLLSR-RPRNWSQCVE-LARLKFEKYF 660 670 680 690 700 710 250 260 270 280 290 300 pF1KB6 GYDPVKLFTKLFKDDIRYLLTMDKLWRK-RKPPVPLDWAEVQSQGEETNASDQQNEPQL- .. ..:. . : ::: : . .:.. ..:: :. . . .: . : :: .: CCDS35 NHKALQLL-HCFPLDIR-LKDGSLFWQSPKRPPSPIKF----DLNEPLHLSFLQNAAKLY 720 730 740 750 760 310 320 330 pF1KB6 -----------GLKDQQVLDVKSYARL--FSKSIETLRV--------HL----------- :. . .:.. : ... :. : ..... :. CCDS35 ATVYCIPFAEEDLSADALLNILSEVKIQEFKPSNKVVQTDETARKPDHVPISSEDERNAI 770 780 790 800 810 820 340 350 360 370 pF1KB6 -----------AEKGD--GAELIWDKDDPSA--MDFVTSAANLRMHIFSMNMKSRFDIKS : :.: : : ..::: .::.:.:.::: ...:.. .:: : CCDS35 FQLEKAILSNEATKSDLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKR 830 840 850 860 870 880 380 390 400 410 420 430 pF1KB6 MAGNIIPAIATTNAVIAGLIVLEGLKILSG-KIDQCRTIFLNKQPNPRKKLLVPCALDPP .::.::::::::.:...::..:: .:. .: .. .. ::: : .: .. CCDS35 IAGKIIPAIATTTATVSGLVALEMIKVTGGYPFEAYKNCFLN--------LAIPIVVFTE 890 900 910 920 930 440 450 460 470 480 490 pF1KB6 NPNCYVCASKPEVTV----RLNVHKVTVLTLQDKI--VKEKFAMVAPDVQIEDGKGTILI . . . .. : .:: .:: : : ::::.. . : . .. : CCDS35 TTEVRKTKIRNGISFTIWDRWTVHGKEDFTLLDFINAVKEKYG-IEPTMVVQGVKMLYVP 940 950 960 970 980 990 500 510 520 530 540 550 pF1KB6 SSEEGETEANNHKKLSEFGIRNGSRLQADDFLQDYTLLINILHSEDLGKDVEFEVVGDAP CCDS35 VMPGHAKRLKLTMHKLVKPTTEKKYVDLTVSFAPDIDGDEDLPGPPVRYYFSHDTD 1000 1010 1020 1030 1040 1050 640 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 06:14:28 2016 done: Sun Nov 6 06:14:29 2016 Total Scan time: 3.650 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]