FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5692, 501 aa 1>>>pF1KE5692 501 - 501 aa - 501 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2419+/-0.000835; mu= 18.2866+/- 0.050 mean_var=65.5744+/-13.105, 0's: 0 Z-trim(106.2): 65 B-trim: 2 in 1/51 Lambda= 0.158383 statistics sampled from 8787 (8849) to 8787 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.645), E-opt: 0.2 (0.272), width: 16 Scan time: 3.160 The best scores are: opt bits E(32554) CCDS2707.1 CYP8B1 gene_id:1582|Hs108|chr3 ( 501) 3447 796.7 0 CCDS13419.1 PTGIS gene_id:5740|Hs108|chr20 ( 500) 1301 306.3 5.1e-83 CCDS6171.1 CYP7A1 gene_id:1581|Hs108|chr8 ( 504) 1087 257.4 2.7e-68 CCDS6180.1 CYP7B1 gene_id:9420|Hs108|chr8 ( 506) 1006 238.9 1e-62 CCDS4916.1 CYP39A1 gene_id:51302|Hs108|chr6 ( 469) 340 86.7 6.1e-17 >>CCDS2707.1 CYP8B1 gene_id:1582|Hs108|chr3 (501 aa) initn: 3447 init1: 3447 opt: 3447 Z-score: 4254.0 bits: 796.7 E(32554): 0 Smith-Waterman score: 3447; 99.8% identity (99.8% similar) in 501 aa overlap (1-501:1-501) 10 20 30 40 50 60 pF1KE5 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS27 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 RTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAKKLVLKVFGYRSVQGDH ::::::::::::::::::::::::::: :::::::::::::::::::::::::::::::: CCDS27 RTKHGDVFTVQLGGQYFTFVMDPLSFGSILKDTQRKLDFGQYAKKLVLKVFGYRSVQGDH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 EMIHSASTKHLRGDGLKDLNETMLDSLSFVMLTSKGWSLDASCWHEDSLFRFCYYILFTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS27 EMIHSASTKHLRGDGLKDLNETMLDSLSFVMLTSKGWSLDASCWHEDSLFRFCYYILFTA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 GYLSLFGYTKDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVGRLQRLFHKML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS27 GYLSLFGYTKDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVGRLQRLFHKML 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 SVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPTSFWALLYLLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS27 SVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPTSFWALLYLLK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 HPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRLRAAPTLLRLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS27 HPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRLRAAPTLLRLV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 HEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLNPNGSRKVDFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS27 HEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLNPNGSRKVDFF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 KTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDTPLPHVDPQRW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS27 KTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDTPLPHVDPQRW 430 440 450 460 470 480 490 500 pF1KE5 GFGTMQPSHDVRFRYRLHPTE ::::::::::::::::::::: CCDS27 GFGTMQPSHDVRFRYRLHPTE 490 500 >>CCDS13419.1 PTGIS gene_id:5740|Hs108|chr20 (500 aa) initn: 1290 init1: 907 opt: 1301 Z-score: 1604.0 bits: 306.3 E(32554): 5.1e-83 Smith-Waterman score: 1301; 40.9% identity (69.2% similar) in 506 aa overlap (4-499:3-500) 10 20 30 40 50 60 pF1KE5 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM :. .:: : ... : : . : ::: ::::: :..::::.:. : :. :: :: CCDS13 MAWAALLGLLAALL--LLLLLSRRRTRRPGEPPLDLGSIPWLGYALDFGKDAASFLTRM 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 RTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAKKLVLKVFGYRSVQGDH . ::::.::. .::.: : ..:: :. .. . . .::: :: :. ..: .:: : CCDS13 KEKHGDIFTILVGGRYVTVLLDPHSYDAVVWEPRTRLDFHAYAIFLMERIF---DVQLPH 60 70 80 90 100 110 130 140 150 160 170 pF1KE5 EMIHSASTKH---LRGDGLKDLNETMLDSLSFVMLTSKGWSLDA-SCWHEDSLFRFCYYI . ... : :. :.:.: .: :.: : . .: : ::: .:. : : . CCDS13 YSPSDEKARMKLTLLHRELQALTEAMYTNLHAVLL---GDATEAGSGWHEMGLLDFSYSF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 LFTAGYLSLFGYT------KDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVG :. ::::.:.: ... :: ......: ::..: :.:... . : . .. CCDS13 LLRAGYLTLYGIEALPRTHESQAQDRVHSADVFHTFRQLDRLLPKLARGSLSVGDKDHMC 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 RLQRLFHKMLSVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPT .. . :.:: .. .. :.:: ..: :.:.:: :: . ..:::.::: ::. CCDS13 SVKSRLWKLLSPARLARRAHRSKWLESYLLHLEEMGVSEEMQARALVLQLWATQGNMGPA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 SFWALLYLLKHPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRL .:: ::.:::.:::. ::: : ..: .:. ..:. .. .:. :::::::. :.::: CCDS13 AFWLLLFLLKNPEALAAVRGELESILWQAEQPVSQTTTLPQKVLDSTPVLDSVLSESLRL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 RAAPTLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLN ::: . : : : .. :..:.:. .:.:: : :::.:: . ::.:. .: ::::.:::: CCDS13 TAAPFITREVVVDLAMPMADGREFNLRRGDRLLLFPFLSPQRDPEIYTDPEVFKYNRFLN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 PNGSRKVDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDT :.::.: ::.: ::....:.::::.: . : :: .:.. .: :..:...:.::::.. :. CCDS13 PDGSEKKDFYKDGKRLKNYNMPWGAGHNHCLGRSYAVNSIKQFVFLVLVHLDLELINADV 420 430 440 450 460 470 480 490 500 pF1KE5 PLPHVDPQRWGFGTMQPSHDVRFRYRLHPTE .:. : .:.::: ::: ::: :::..: CCDS13 EIPEFDLSRYGFGLMQPEHDVPVRYRIRP 480 490 500 >>CCDS6171.1 CYP7A1 gene_id:1581|Hs108|chr8 (504 aa) initn: 838 init1: 318 opt: 1087 Z-score: 1339.6 bits: 257.4 E(32554): 2.7e-68 Smith-Waterman score: 1087; 35.5% identity (69.7% similar) in 512 aa overlap (2-497:6-501) 10 20 30 40 50 pF1KE5 MVLWGPVLGALLVVIAGYLCLPGML--RQRRPWEPPLDKGTVPWLGHAMAFRKNMF ..:: ..::. :: .: :.:. ::::..: .:.:: :. : : . CCDS61 MMTTSLIWG-------IAIAACCCLWLILGIRRRQTGEPPLENGLIPYLGCALQFGANPL 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 EFLKRMRTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAKKLVLKVFGYR :::. . ::: ::: .: :.: :. .:::. .: . .:. .. :.::.: CCDS61 EFLRANQRKHGHVFTCKLMGKYVHFITNPLSYHKVLCHG-KYFDWKKFHFATSAKAFGHR 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 SVQ---GDH-EMIHSASTKHLRGDGLKDLNETMLDSLSFVMLTSKGWSLDASCWHEDSLF :.. :. : :... : :.: .:..:.:.:...:. .: . . .. : .... CCDS61 SIDPMDGNTTENINDTFIKTLQGHALNSLTESMMENLQRIMRPPVSSNSKTAAWVTEGMY 120 130 140 150 160 170 180 190 200 210 220 pF1KE5 RFCYYILFTAGYLSLFGYTKDKEQDLLQAGEL--FMEFRKFDLLFPRFVYSLLWPREWLE ::: ..: ::::..:: . .: .: : . .:..:: .:: .: .: : . .. CCDS61 SFCYRVMFEAGYLTIFGRDLTR-RDTQKAHILNNLDNFKQFDKVFPALVAGL--PIHMFR 180 190 200 210 220 230 240 250 260 270 280 pF1KE5 VGRLQRLFHKML-SVSHS--QEKEGISNWLGNMLQFLRE--QGVPSAMQDKFNFMMLWAS ... : .:. :. : :..:.::. : .. .:: . . . . : ....:::: CCDS61 TAHNAR--EKLAESLRHENLQKRESISE-LISLRMFLNDTLSTFDDLEKAKTHLVVLWAS 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE5 QGNTGPTSFWALLYLLKHPEAIRAVREEATQVLGEARLETK---QSFAFKLGALQHTPVL :.:: :..::.:. ....:::..:. ::. ..: .: ... . . .. . :. ::: CCDS61 QANTIPATFWSLFQMIRNPEAMKAATEEVKRTLENAGQKVSLEGNPICLSQAELNDLPVL 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE5 DSVVEETLRLRAAPTLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEP ::...:.::: .: .: ..::.::.. .:. : .:. ::.::.: : .:.::.:.:.: CCDS61 DSIIKESLRLSSASLNIRTAKEDFTLHLEDGS-YNIRKDDIIALYPQL-MHLDPEIYPDP 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE5 TVFKYDRFLNPNGSRKVDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTH .:::::.:. ::. :. :. .: :...: ::.:::..:::::.::. :.: :..::... CCDS61 LTFKYDRYLDENGKTKTTFYCNGLKLKYYYMPFGSGATICPGRLFAIHEIKQFLILMLSY 410 420 430 440 450 460 470 480 490 500 pF1KE5 FDLELVDPDTPLPHVDPQRWGFGTMQPSHDVRFRYRLHPTE :.:::.. .. : .: .: :.: . : .:..:.:.. CCDS61 FELELIEGQAKCPPLDQSRAGLGILPPLNDIEFKYKFKHL 470 480 490 500 >>CCDS6180.1 CYP7B1 gene_id:9420|Hs108|chr8 (506 aa) initn: 750 init1: 249 opt: 1006 Z-score: 1239.6 bits: 238.9 E(32554): 1e-62 Smith-Waterman score: 1006; 36.1% identity (66.9% similar) in 504 aa overlap (3-497:19-504) 10 20 30 40 pF1KE5 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLG : : .:.: :...: ::: . : ::: :::: :: .:.:: CCDS61 MAGEVSAATGRFSLERLGLPGLALAAALLLLA--LCLL-VRRTRRPGEPPLIKGWLPYLG 10 20 30 40 50 50 60 70 80 90 100 pF1KE5 HAMAFRKNMFEFLKRMRTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAK .. .::. ..:.: .. .:::.::: :::.:.::..::... ..:. ...:.: ... CCDS61 VVLNLRKDPLRFMKTLQKQHGDTFTVLLGGKYITFILDPFQYQLVIKN-HKQLSFRVFSN 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE5 KLVLKVFGYRSVQGDHEM---IHSASTKHLRGDGLKDLNETMLDSLSFVMLTSKGWSLDA ::. :.:. ..: .:.: .: . :.: .: : :.:...:. :. . : . CCDS61 KLLEKAFSISQLQKNHDMNDELH-LCYQFLQGKSLDILLESMMQNLKQVF---EPQLLKT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE5 SCWHEDSLFRFCYYILFTAGYLSLFGYTKDKEQDLLQAGELFMEFRKFDLLFPRFVYSLL . : :. :: :.: . ...: . ... . .:: .: ::: : .: .. CCDS61 TSWDTAELYPFCSSIIFEITFTTIYGKVIVCDNNKF-ISELRDDFLKFDDKFAYLVSNI- 180 190 200 210 220 230 230 240 250 260 270 pF1KE5 WPREWLEVGRLQRLFHKMLSVSHSQEKEGISNW---LGNMLQFLREQGVPSAMQ-DKFNF : : : : .. . .:... :.. ...: . . . :.. : .. .. CCDS61 -PIELL--GNVKSIREKIIKCFSSEKLAKMQGWSEVFQSRQDVLEKYYVHEDLEIGAHHL 240 250 260 270 280 280 290 300 310 320 330 pF1KE5 MMLWASQGNTGPTSFWALLYLLKHPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHT .:::: .:: :: :::. :::.::::. :::.: ..: . . ..: ..: : CCDS61 GFLWASVANTIPTMFWAMYYLLRHPEAMAAVRDEIDRLLQSTGQKKGSGFPIHLTREQLD 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE5 PV--LDSVVEETLRLRAAPTLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPD . :.: . :.::: . : .:.:.:: ::. .: .: :.::..:.:: . .: ::. CCDS61 SLICLESSIFEALRLSSYSTTIRFVEEDLTLSSETG-DYCVRKGDLVAIFPPV-LHGDPE 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE5 IHPEPTVFKYDRFLNPNGSRKVDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFIL : : :.::::.. .:..:. ::: :::.. : ::.:.:.: :::::::: :.: ... CCDS61 IFEAPEEFRYDRFIE-DGKKKTTFFKRGKKLKCYLMPFGTGTSKCPGRFFALMEIKQLLV 410 420 430 440 450 460 460 470 480 490 500 pF1KE5 LMVTHFDLELVDPDTPLPHVDPQRWGFGTMQPSHDVRFRYRLHPTE ...:.::::..: : :. .. .: :: . :. :: :::.. CCDS61 ILLTYFDLEIID-DKPIG-LNYSRLLFGIQYPDSDVLFRYKVKS 470 480 490 500 >>CCDS4916.1 CYP39A1 gene_id:51302|Hs108|chr6 (469 aa) initn: 428 init1: 151 opt: 340 Z-score: 417.6 bits: 86.7 E(32554): 6.1e-17 Smith-Waterman score: 519; 26.5% identity (58.0% similar) in 498 aa overlap (7-496:3-466) 10 20 30 40 50 60 pF1KE5 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM ... ...: : : : .:... .:: :: .::.: .. : : .::... CCDS49 MELISPTVIIILGCLALFLLLQRKNLRRPPCIKGWIPWIGVGFEFGKAPLEFIEKA 10 20 30 40 50 70 80 90 100 110 pF1KE5 RTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAKKLVLKVFGY-RSV-QG : :.: .::: :. .::: . ... .:: ..:.:: ....: .. . ..: . CCDS49 RIKYGPIFTVFAMGNRMTFVTEEEGINVFLK--SKKVDFELAVQNIVYRTASIPKNVFLA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 DHEMIHSASTKHLRGDGLKDLNETMLDSLSFVM--LTSKGWSLDASCWHEDSLFRFCYYI :: .. .. .:.... . . : . : ..: ..: . . :. . CCDS49 LHEKLYIMLKGKMGTVNLHQFTGQLTEELHEQLENLGTHG-TMDLNNLVRHLLYPVTVNM 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 LFTAGYLSLFGYTKDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVGR-LQRL ::. :::. .: : ... : ... : .. .:. :: :.: . . . .: CCDS49 LFNK---SLFSTNKKKIKEFHQYFQVYDEDFEYGSQLPE---CLL--RNWSKSKKWFLEL 180 190 200 210 220 240 250 260 270 280 290 pF1KE5 FHKML-SVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPTSFWA :.: . ... . . : : . . : . . . ......:::: .:. :..::. CCDS49 FEKNIPDIKACKSAKDNSMTLLQATLDIVETETSKENSPNYGLLLLWASLSNAVPVAFWT 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE5 LLYLLKHPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRLRAAP : :.:.::. .:. : ..:.:.: :... . :.. .. : ::.::.: CCDS49 LAYVLSHPDIHKAIMEGISSVFGKA---GKDKIKVSEDDLENLLLIKWCVLETIRLKAPG 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE5 TLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLNPNGS .. : : .: .:.. ::.: : :. .: .: ::: .:: .:. . : CCDS49 VITRKV-----VKPVEILNYIIPSGDLLMLSPFW-LHRNPKYFPEPELFKPERWKKANLE 350 360 370 380 390 420 430 440 450 460 470 pF1KE5 RK--VDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDTPL .. .: : : .::: ::.:.::: ::.. :.:.. ..: :.:: : CCDS49 KHSFLDCF----------MAFGSGKFQCPARWFALLEVQMCIILILYKYDCSLLDP---L 400 410 420 430 440 480 490 500 pF1KE5 PHVDPQRWGFGTMQPSHDVRFRYRLHPTE :. . . :. :: . :..:. CCDS49 PKQSYLHL-VGVPQPEGQCRIEYKQRI 450 460 501 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:53:08 2016 done: Tue Nov 8 05:53:09 2016 Total Scan time: 3.160 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]